色々なブログを読んでいて、タグの付け方がもったいないなぁと感じることが多いので、それについてちょっとまとめてみました。と言っても自分自身の分類ルールに一貫性があるかと問われるとまったくそうではありません。これは自分自身のメモでもあります。
カテゴリーとタグ
ブログシステムにはカテゴリー(Category)とタグ(Tag)という2つの機能がありますが、この2つの違いをあまり意識したこともない人も多いのではないでしょうか?
とりあえずそこに何かを入力しておけば、あとでカテゴリー別、タグ別に記事を表示できるということくらいのことは知っていても、その分類ルールについては深く考えたことのない人がほとんどではないでしょうか?
カテゴリー
まず、カテゴリーについてですが、これは生物分類上の概念から端を発しています。生物分類において、1つの生物を2つにまたがる分類をすることは絶対にあり得ません。すなわち、魚類であって哺乳類でもあるということは絶対にないのです。(もっとも2つの類の中間的な生物が居たとしてもどちらかに分類せざるを得ません)
ブログシステムにおけるカテゴリーも同様です。その記事がどういう内容なのかを、唯一1つの場所へ分類しようとするのがカテゴリーの考え方です。
これは、MECE(もれなくダブりなく)の「ダブりなく」にあたる考え方でもあります。(※注 ブログシステムによっては1つの記事に2つ以上のカテゴリーを付与できるものがあるが、これは本来のカテゴリーの意味を拡大解釈して単なるキーワードの意味で、あるいはタグの意味として実装してしまっているものと思われる。)
カテゴリーが機能しない場合
分類の対象が実体の場合は、物体は常に一つの場所にしか存在し得ないので上記のカテゴリーの概念が非常にうまく機能します。しかし、ブログシステムも含む仮想(バーチャル)世界においては、物体は実体をもたない仮想として存在し得えます。(仮想という名前がしっくりこないのであれば別名と言ってもいいでしょう。)
ブログシステムの記事は唯一の実態を持つのでは?と疑問を持つかもしれません。確かにブログシステム記事は電気的なデータとしてはただ1つの領域に格納されており、そういう意味で言えば実態は1つです。
ただ、OSなりCMSなりというフィルターを通してわれわれがこの実態を見る場合には、ある意味で仮想的な世界を見ているに過ぎません。その仮想世界においては、上記のカテゴリーという概念だけではうまく機能しないのです。
単純な例で考えてみる。場所(大阪および東京)と関係(仕事および交遊)という2つの軸でカテゴリー的な分類をするとします。
- Aさん-大阪で仕事関係
- Bさん-大阪で交友関係
- Cさん-東京で仕事関係
- Dさん-東京で交友関係
その場合、次のようないずれかのカテゴリー分類をすることになります。
(1)場所軸を優先した場合
┌大阪┬仕事-Aさん
│ └交友-Bさん
└東京┬仕事-Cさん
└交友-Dさん
(2)関係軸を優先した場合
┌仕事┬大阪-Aさん
│ └東京-Cさん
└交友┬大阪-Bさん
└東京-Dさん
これでうまく機能する場合もあるだろう。しかし時には、仕事と交友をはっきり分類できないこともあるし、どちらにも分類したいときもあるだろう。そういう場合はカテゴリーでは歯が立たない。そこで登場する概念がタグというものである。
タグ
カテゴリーが階層的な分類とすれば、タグはフラットな分類とも言える。カテゴリーとタグの大きな違いは、カテゴリーが1つの記事に対して唯一1つしか付与できない(ブログシステムによっては複数付与できるのは前述したとおり)のに対して、タグは1つの記事に対して複数付与できる点である。
システム上付与できる数には上限はあるものの、論理上はいくつ付与してもかまわないことになっている。
タグによる分類で先の例を分類し直すと次のようになる。
- Aさん-大阪 仕事
- Bさん-大阪 交友
- Cさん-東京 仕事
- Dさん-東京 交友
また、東京で公私ともに付き合いがあるEさんは次のように分類できる。
- Eさん-東京 仕事 交友
それぞれのタグで次の人が引っかかる
- 大阪-Aさん Bさん
- 東京-Cさん Dさん Eさん
- 仕事-Aさん Cさん Eさん
- 交友-Bさん Dさん Eさん
タグの問題点
タグの欠点はそれが階層を持たないことである。階層を持たないためややもすると全体の構造を把握するのが困難になる。そのため”タグクラウド”のように、タグの使用頻度に応じてウェイトを付けて視覚化するような試みがあるが、これとて単に使用頻度にウェイトを置くことに意味があるのかどうかは大いに疑問ではある。
上記の例で言えば、もはや東京と大阪、仕事と交友が同じ分類軸なのかどうかは一見分からない。大阪、東京、仕事、交友という4つのタグに上下関係はなくまったくのフラットな関係である。それぞれのタグがどのような分類軸にあるかはタグを付与する人に委ねられている。
そういう意味ではタグの付け方は非常に大事だと言えよう。冒頭で述べた、「とりあえずそこに何かを入力しておけば、後でカテゴリー別、タグ別に記事を表示できる」くらいの意識でタグを乱発してしまうと、対象が多くなってくると必要な時にすぐに取り出せなくなり、システムとして破綻するのは確実である。
日々記事が流れてしまっても問題ない、フレッシュさを重視する記事であればそれでも良いだろうが、そうでないナレッジの蓄積としてブログシステムを活用しようとするのであればこれは致命的な問題である。そこで、問題となるのは分類ルールをどうするか?ということである。
分類ルール
(ルール1)
カテゴリーと重複させない。カテゴリーはMECE(もれなくダブりなく)の考え方で分類する。カテゴリーと重複するタグをつけるのは冗長である。タグは1つの記事に対して2つ以上の属性を持ちうるような分類軸に対して付与するべきである。
(ルール2)
分類軸の中ではMECEになるように。例えば、場所という分類軸に”近畿”などという分類を持ち込んではいけない。持ち込むとすれば他の分類軸とするべきである。
(ルール3)
可能な限り、分類軸が判別できるような識別子をタグ名に付ける。先述したとおりタグの欠点はそのフラットな関係性である。どのタグがどの分類軸のものかを分かるような識別子を付与することでこの欠点をある程度補うことができる。
(タグ命名例1)
- 場所(大阪)
- 場所(東京)
- 関係(仕事)
- 関係(交友)
(タグ命名例2)
- 場所-大阪
- 場所-東京
- 関係-仕事
- 関係-交友
(タグ命名例3)
- A大阪
- A東京
- B仕事
- B交友
-
ファイルシステムにおけるカテゴリー、タグの概念
Windowsにおける、フォルダやファイルも、カテゴリー分類の1種である。Unix系のOSでは、実体に対して仮想を2つ以上もつことが許されるものがある。例えばハードリンク、シンボリックリンクと言った概念である。※良く調べてみると、Windowsにもこれらの機能が実装されていることが分かった。(ただし一般的ではない)
Windowsにおいては、WindowsVistaにおいてやっとシンボリックリンクの機能が実装された。また仮想フォルダという新しい機能が実装された。ただし、この仮想フォルダは検索条件に一致したファイルに対するショートカットのグループに名前を付けておくというくらいの機能であるから、タグの概念とは随分と違うものである。
将来的にはタグの概念を持つファイルシステムを搭載したOSが誕生することが期待される。現状ではこの概念に近い仮想フォルダを作成できるアプリケーションがあることはあるのだが、まだ使い勝手や概念の相違があり不十分と言える。これを開発すれば大きな注目を浴びることは間違いないだろう。
まとめ
ほとんどのブログシステムでは全文検索機能を実装している。そのため、自分のための備忘録として記事を書くのであれば分類ルールについて深く考える必要性は薄いのかもしれない。
しかし、他者に読んでもらおうとするのであれば、一貫したルールにのっとり分類することによってアクセシビリティーは格段に向上するだろう。
アクセシビリティーというと、UI(ユーザーインターフェース)やプレゼンテーション(見た目)のことに眼が行きがちではあるが、コンテンツをどう論理的に整理して見せるかということは意外と大切だと思うのである。
※ アクセシビリティーというと、ハンディキャップを持つ人がいかに使いやすいかということとユーザーのブラウズ環境に左右されないという狭義で使われることが多いようですので、上記はより広義の「ユーザービリティー」の意味と置き換えてお読みください