aが憎い

検索エンジンの質の低下はなるべくしてなったのではないかという話 - 空気を読まない中杜カズサを読んで、aタグに憎悪が沸いた。最初全然関係ない話のように見えますが我慢して読んでください。


データの特性はリンクということを以前読んだ。どこで読んだのか忘れてしまったけど、的を得ていると思う。

ハイパーテキストであれば、テキスト同士の繋がりがリンクというカタチで実際に示されているし、通常のテキスト、例えばある言葉の定義一つとってみても、別の言葉を使って説明するのだから、別の言葉の定義なしにはそのテキストは成立しない。テキストは必ず他のテキストとセットになっている。

HTMLもハイパーテキストの一つなので、リンクが存在します。そして、このリンクを解析することで、インターネットの構造を探求しようとか、よいページを見つけようとしている研究室・企業も多い。しかしながら、リンクを解析しても、有益なことを引き出すのは相当難しいと考えます。


なぜなら、リンクにはいくつもの種類があるにも関わらず、リンクのタグはaタグ一つしか無いから。

リンクは大別して5種類の役割があると思います

言及・引用

別の記事を言及したときに貼るリンク。

逆参照・トラックバック

言及されたことを示すリンク。

定義

言葉の定義を辿るためのリンク。はてダだったりすると、かってにはてなキーワードへのリンクが貼られたりする。時々、この記事のこの単語の定義に沿いますという引用の意味が含まれることも。

紹介

関連する複数の記事を紹介するリンク。ニュースサイトのリンクもこちらに属します。ニュースサイトは引用・言及としてのリンクが含まれることがあります。サイトリングもこれに属しますかね。

構造の構築

サイト内の構造を作るためのリンク。


リンクにはこれだけの意味合いがあります。おそらく見逃している種類のリンクもあるかもしれないです。これをaタグ一つで表現するのは無理があるでしょう。ですが、現実にはaタグで表されています。それゆえ、リンクごとの役割を理解しないまま解析をするので、有用な結果はほとんど望めないでしょう。

また、最も使われるリンクのリンクは「定義」でしょう。なぜなら、文章の言葉の数だけリンクが貼られる可能性があるから。ですから検索エンジンWikipediaはてなキーワード、はたまた商品の定義と見なせる有名販売サイトの販売ページに行き着くのはある種の必然だったのだろうと思うんですよね。

前置きが長かったですがようやく繋がりましたw

だから検索が復権するためには、リンクの種別を分類し、分類に沿って解析をする必要があります。でもそれを果たすための方法は2つしかありません。一つ目の方法は、このページのこの部分は、この種類のリンクしかないと設定していくという方法。人力でこつこつやらせるしかないですね。もう一つの方法は、リンクを示すタグの種類を増やす方法。こちらはHTMLの仕様から変えていかなきゃなりません。どちらにせよ相当な困難を伴います。

最初からリンクを示すタグが沢山種類があれば良かったのに。まあ仮にそうであったとしても、インターネット黎明期には意味が正しく理解されず混在しつつも、ある程度熟してくれば今より少しは良い状況になったんじゃないかなぁ。