天使のつぶやき NO8020

おそるべしGoogle 


千成記


白川勝彦がウェブログを開始 (※サイト紹介)

http://www.asyura2.com/0610/senkyo28/msg/543.html

投稿者 kaname 日時 2006 年 11 月 26 日 18:50:48: 3X28X40b0xN.U

http://www.liberal-shirakawa.net/tsurezuregusa/

阿修羅情報によって白川勝彦氏のブログを訪問したところ、以下のような内容がありました。


おそるべしGoogle

No.258

昨日、私の携帯電話に『週刊新潮』の記者から電話があり、取材したいことがあるというので、さっき会ってきた。警察に捕まったわけでもない、特別に過激なことを発言した訳ではないというのに、一体何を訊きたいというのか不審に思ったが、変なことを書かれても迷惑なので、まずは会うことにした。その記者から聞いたことに私は本当に驚いた。

週刊新潮の記者が私に訊きたかったのは、永田町徒然草No.255で触れた週刊金曜日主催の「緊急市民集会」のことであった。そのことについては、昨日の電話でも触れられていた。私は前から電話による取材は応じないことにしているので、会うことになったのである。この記者さんが私に件の会のことを訊きたいと思ったキッカケは私のWebサイトをみて、私がこの会に行ったことを知ったのだとばかり思っていた。私のWebサイトをいつも見てくれているのだから、ありがたい"お客さん"だ。念のため確認すると、驚くべき答えが返ってきた。 Googleで検索して知ったというのだ。

私も時々Googleで検索することはある。しかし、それはWebサイトを探すためである。この検索をしている時に、Webサイトではない記事も引っかかってくるが、それは見出しなどに該当する文言があるからだとばかり思っていた。件の週刊金曜日の緊急市民集会に関する私の記事は、見出しとか小見出しにそのようなものはない。本文の中にこのことが書いてあるだけである。だがこれをGoogleは拾い上げたというのだ。このことは、私にとって大いなる驚きであった。

Googleが最近なにかと注目されていることは知っていた。だが、私がWebサイトを開設した頃(約6年前)、検索はYahooが主流であったと思う。だから、Webサイトの検索を私は主としてYahooを使っていた。Googleはそれで検索できない時に使っていた。Googleに対してそんな認識しかなかった私なのである。だから、無数にあるWebサイト上の文章の中から、私が週刊金曜日主催の緊急市民集会にいったことを拾い上げたGoogleは、私にとって大きな驚きであり、新しい認識であった。

私に対する質問は、別にたいしたことではなかった。その集会のあるコントに関するものだった。皇室に関するコントで、一部問題にする人がいたので、これをみた私の感想を聞きたいとのことであった。私は自分が見たこと・感じたことをそのまま述べた。それだけのことである。私のコメントを記事に使うかどうかは判らない。

そんなことはどうでもいいのだが、私はこの経験を通じてエシュロンのことを思い出した。6?7年前、栗本慎一郎代議士が盗聴法がらみで盛んに私に大問題だといっていたのである。エシュロンのことは今日までついに勉強することはなかったが、「白川勝彦」「shirakawa katsuhiko」などといったいくつかのキーワードを指定しておけば、インターネット回線を走るデジタル情報の中からこれを拾い上げることは可能なのではないか?

Webサイト上の記事はもともと公表されているのだから仕方ないが、メール(正しくはインターネット・メールという)をこういうことでピックアップできるとしたら、当然のこととしてそのメールの中身も見ることができるのであろう。こうしたことが可能だとしたら、通信の秘密なんてあったものじゃない。それは本当に大問題だ。暗号化して送ることも可能だろうが、素人のする暗号などアメリカの国家機関が解読するのはいとも簡単なことであろう。私は私で勉強するが、このことに詳しい人はメールで教えてほしい。メールの送り方は、前号の最後に書いておいた。おっと、この記述もまたGoogleは拾っちゃうのかな。しかし、もう一度公表しているのだから仕方ないか 。

「白川、お前はインターネットにかなり詳しいと思っていたが、この程度のことも知らなかったのか」といわれそうだが、残念ながら以上述べたことは事実なのであるから仕方ない。恥をあえて覚悟でこれを書いた。ある事実を知らないことは、それ自体決して恥ずかしいではない。しかし、ある事実を知りながらそれに対する対処や行動をしないことは、恥ずかしいことであり時には責められても仕方ないというのが私の考えである。

それでは、また。

06年11月25日 06時17分PM 掲載

分類: 1.徒然


julaさんのメール

jula です。

GoogleとYahoo、ちゃんと調べて書いた訳ではないですが、大雑把には以下のような感 じのはずです。

Yahooは元々人気サイトを手作業で拾い上げていて、そもそもが人手で振るい分けられ ていました。

「ローカルなところは初めから対象外として振るい落としてしまう。」

なんて のも当たり前のようでした。

元々が面白く有用なLink集みたいなところから始まったようです。

今もそのままという訳ではないでしょうが、ポータルサイトとしての利便性を前面に置 いた場合、その傾向は残っているのかもしれません。

一方でGoogleはそれに対抗する形で、人手を介さず機械任せとしていました。

世界中のサイトをロボットでめぐらせ、検索キーワードと合致する文章を予め自分のと ころにキャッシュする。

このキャッシュを使い検索するため、常に自社でデータ検索をしている形です。

人手での選別がされていないため、

「どういった地方や時間帯、傾向の元検索がなされる のか?」

などのデータの解析にも利用可能です。

このため、極ローカルであっても検索結果に引っ掛かってくるという網羅性に優れます。

Yahooは商品検索には優れるようですが、なんとかどこかから情報を引き出そうとする と、網羅性に欠ける気がします。

Googleは検索システムとそのデータをデータベースのコアとして位置付けているようです。

これに商品情報、地図情報、ニーズ、傾向などなど様々なファクターを関連付ける 事で、より有用な検索ができるように、日々拡張が図られているようです。

HサイトのTopページなどで、ページの下半分が真っ黒で何もかかれていない。でも選択 して反転すると、キーワードが羅列され、かつ何度も繰り返されている、なんてのがち ょっと前まで良くありました。

これも、キーワードでなく文章中のキーワードを拾い集 めてくれる仕組みを利用していた訳です。

因みに、最近Googleはこの類のページがあった場合は、サイト毎ブロックして検索対象 から外してしまう策に出ているようです。

商品検索なども増えていますので、単純にキーワードが沢山羅列され、かつそのそれら のキーワードが繰り返されたサイトを検索結果として提示したのでは、検索結果の有意 性が損なわれます。 fs 検索結果の品質を上げるために、そのような策も講じられてきているとのことです。

Googleはそもそもタイトルだけでなく、ページの内容も検索対象とされています。です ので、書かれているであろう内容を想像して、含まれるであろうキーワードを幾つか並 べると、探したい情報により近い結果が得られ易くなります。

エシュロンであれば、例えば、国と国のブリッジとなるサーバー、通信衛星などのデー タをどこかでフィードバックさせるような形でキャッシュで溜め込んでいるのかもしれ ませんね。