本文へ移動

OA・コンピュータ バックナンバー

シソーラスと検索エンジン

シソーラス (Thesaurus)という言葉をご存じでしょうか。

 通常、同義語関係、類義語関係、単語の上位・下位関係、部分・全体関係、などによって単語を分類し、体系づけた辞書のことを指します。

 検索して記事が見つからなかったときや、逆に検索された記事が多すぎたときにより適当な検索キーを探すためにシソーラスが用いられます。
 なお、過去に作成されたワープロなどの文章の検索の際、ワープロソフトの検索・置換機能は、「「ひらがなカタカナ」「語のゆらぎ」などを除いてねほぼ「語彙一致」でなければヒットしませんが、特別の検索ソフトを利用すれば、シソーラスを利用して、同義語も検索対象としてヒットさせてくれます。

1 表記の揺れ
  表記の揺れ
  同義語で発音も同じものを表記の揺れと言います。
  「犬」「イヌ」「いぬ」
  「差し押え」「差押え」「差押」「差しおさえ」などです。
   句点 (。)または(.)、読点 (、)または(,)もばらばらです。
  うっかり他人の文章を「コピペ」すると、そこだけ句読点が違ってきます。
2 同義語
 a 外来語
   本来の「やまと言葉」の他に、「漢語」や「外来語」があります。
   「打合せ」と「会議」と「ミーティング」は、同義語ですね。
 b 省略形
   「ワードプロセッサー」と「ワープロ」のようなものです。
 c 年号
   日本なら「西暦」と「元号」が利用されています。昔は「紀元」も利用されていました。
   海外に行けば、「イスラム暦」とか「中華民国暦」とか見慣れないものもあります。
 d 立場による語の違い
   立場によって同じことを違った語で現す場合があります。例えば、経営の「合理化」「スリム化」、対して、「首切り」という人もいますし、中立的に「リストラ」という人もいます。
 e 言葉の進歩と陳腐化
   今日び「アベック」という人は、あまりいませんね。いるとしたら相当な高齢者でしょう。「カップル」が一般的だと思います。
  「二人連れ」は「歌詞」くらいにしか出てきません。案外新鮮に聞こえます。
3 広義語・狭義語
  「裁判官」から見ると「判事」や「判事補」は部分的な意味概念なので狭義語(下位語ともいう)になります。逆に「裁判官」から見ると「法曹」や「公務員」が広義語(上位語ともいう)になります。
4 反義語
  「無知」というか「知識がない」というか、「あほ」というか「利口でない」というかの問題です。
  ほぼ、同じ意味ですね。
5 関連語
  意味的な関連性を持つ語の関係を言います。大きく分けると同じ「カテゴリ」の語と、異なる「カテゴリ」の語との関係があります。


 GoogleやYahooなどの検索エンジンで検索する場合を考えてみましょう。

 いろいろな人によってすでに書かれている記事を探すわけですから、用語の統制を図ることは不可能です。漏れなく検索するためには、普通に考えられるすべての語で検索してみる必要があります。

 しかし、人間がしなくても、検索エンジンにシソーラス機能がありますから、あまり気にする必要はないようです。検索キーワードに同義語や関連語などを自動的に付加して検索されるようになっています。

 必要かつ十分というのは難しいですね。
 本来ヒットしてもらわないといけいないサイトが漏れていたり(取りこぼし)、逆に、本来の目的ではないサイトなどが表示されたりします(ノイズ)は、どうしても生じます。


 検索する側は、検索エンジンで見たい情報が掲載されているサイトを探す場合、単数のキーワード以外に複数の「キーワード」を入れる使い方をしますよね。
 検索エンジンは、「キーワード」を並べると「and」検索になっているのか、「or」検索になっているのか判然としませんが・・。いずれにせよ「複数」の「キーワード」を入力するのが有効です。


 例えば単純に「弁護士」と入力すると「弁護士」に関するサイトが結果として登場します。
 しかし、「弁護士とは、そもそも何か」という検索をする人は余りいないわけで、弁護士に事件依頼したいのなら、地域で特定、例えば「大阪」などというキーワードを付加したり、「自己破産」や「交通事故」や「離婚」を付加したりして、より自分のニーズにあった結果が得られます。

 なお、さすがに「交通事故」や「離婚」などは、司法書士や行政書士のサイトはあまりヒットしませんが、「大阪」「自己破産」として検索すると、弁護士の他に、「司法書士」のサイトがヒットすることは、ある意味当然ですが、本来、「自己破産」の仕事ができない「行政書士」などのサイトもヒットしますから、びっくりします。
あたかも、行政書士が、「破産できます」というサイトがあって、二度びっくり。何とか取り締まれないものか・・

 と、横道にそれましたが、目的のサイトにたどり着くためには「キーワード」の選択が大切です。
 試行錯誤でいいですから、キーワードを増やしたり、減らしたり、変えてみたりして工夫していただけば、目的のサイトに到達できる早道です。


 なお、サイトをつくる側にも工夫が要ります。

 本来「弁護士法」により、弁護士の事務所は、「法律事務所」と定められていて、「弁護士事務所」などは日本に存在しないというのが正解です。
 しかし、現実には「法律事務所」で検索する人はほぼ皆無なわけで、普通の人が検索する「弁護士事務所」と併記しておく方が無難です。弁護士の事務所は、「法律事務所」というということを正確に知っているのは同業者くらいであり、本来検索してもらいたいターゲットとは異なります。
 「個人民事再生」という法律用語も一般には使われません。「個人再生」と一般に呼ばれていますし、検索も「個人再生」でなされます。
 「債務整理」という言葉は、弁護士が使う用語であって、普通の人は「借金」「整理」で検索するようです。

 私のサイトは、文章を自分で作成していますから、「法律事務所」「個人民事再生」「債務整理」などで統一するなど、:検索に際して、利用者のことを考えない「ひとりよがり」のホームページだったのですが(ただ、正確な用語です)、少し「利口」になって、正確さはありませんが「使う人の立場に立った」ホームページに、少しずつマイナーチェンジをしています。

TOPへ戻る