パンプキンスパイスラテ

IT系のことが多めの日記帳です

Web情報アーキテクチャ 第9章 シソーラス、制限語彙、メタデータ

Web情報アーキテクチャを読んでまとめてみる。

Web情報アーキテクチャ―最適なサイト構築のための論理的アプローチ

Web情報アーキテクチャ―最適なサイト構築のための論理的アプローチ

9.1 メタデータ

ナビゲーションと検索の向上を目的として、コンテンツのオブジェクトを描写するためにメタデータが使われる。
簡単な例としては、HTMLキーワードメタタグなどがある。

疑問:「メタデータで動く動的なサイト」とは?

9.2 制限語彙

語彙の制限には幅がある。

同義語の輪

同義語の輪とは、同義語の言葉であると定義された単語をつなぎ合わせたもの。
同義語の輪を使用して検索を行うと、再現率は上がるが適合率が落ちてしまう。再現率比と適合率比の両方を高くするのは難しい。2つのバランスをとる必要がある。それにはインターフェースデザインを良くして、ユーザーの目的をよく理解することが大事。

典拠ファイル

典拠ファイルとは、優先語を一覧にしたもの、と厳密には定義される。バリエーションや同義語は含まれない。アメリカの州の略は良い例。
典拠ファイルの使用には3つの視点からの価値がある。

  • コンテンツの著作者とインデックス供給者・・・承認された用語を効率的に、かつ一貫性を持って使うことができる。
  • 制限語彙マネージャー・・・優先語があるおかげで制限用語の追加、削除、変形を効率よく行うことができ、同義語の中からどれを使えばよいかの判定ができる。
  • ユーザー・・・優先語を示すことで教育できる。スペルミスを直したり、業界用語を説明したり、ブランド名の認識を高めたりすることができる。

検索からブラウジングに移る際に、用語のローテーションを行う(ポインターを使う)と優先語へユーザーを導きやすくなる。

分類体系

優先語を階層として変化させることを「分類体系」という。分類体系は、「異なる形式をとれるし、複数の目的を果たせる」。

疑問:異なる形式とは?

分類体系はフロントエンドのインターフェースとしても利用できるし、バックエンドの検索のコンテキストとしても利用できる。

シソーラス

シソーラスとは、検索向上のために同義性、階層性、関連性を明らかにした制限語彙のこと。同意義関係、階層関係、連合関係の3つの基本からなっている。これらの関係は、検索・ナビゲーションのために違う方法で役立つ。

9.3 技術専門用語

専門用語の解説

9.4 作動中のシソーラス

シソーラスの好例を見つけることが難しいのは、「数少ないため」と「ぱっと見てわからない」から。

9.5 シソーラスのタイプ

シソーラスのタイプは「古典的シソーラス」「インデクシングシソーラス」「検索シソーラス」の3つがある。

古典的シソーラス

疑問:「古典的シソーラス」とは?

インデクシングシソーラス

インデックスに一貫性を持たせること。サイトを頻繁に訪れる人々にとって価値がある。例えばイントラサイトなど。

検索シソーラス

クエリを実行する前に、検索ワードと制限語彙とを対応づけることで、適合率を犠牲として再現率を向上させることができる。

9.6 シソーラス標準

ガイドラインを完全に順守するのではなく、納得できる部分は取り入れ、必要に応じて標準から外れても構わない。

9.7 語義の関係

シソーラスと単なる制限語彙の違いは、語義(言葉の意味)がしっかりと整理されていること。
「等価関係」「階層関係」「連想結合関係」の3つがある。

9.8 優先語

優先語の語形を決めるのはANSI/NISOシソーラス標準のガイドラインに従うことをおすすめしている。

ANSI/NISOシソーラス標準
  • 文法的語形
  • スペル
  • 単数形と複数形
  • 略語と頭字語

9.9 平行階層

大規模な情報システムに対処するときは平行階層は避けられない。

9.10 ファセット分類

ファセットの中には必ず階層的に表示しなければならないものがある一方、均一なものもある。
ファセット分類アプローチの長所は、素晴らしい能力と柔軟性である。
ファセット分類は耐久性のある基盤を提供し、その一方インターフェースは時代とともに試され、修正されていく。