情報を発想力に変える技術

2006年12月21日木曜日 Ryoichi MURASHIMA 0 Comments

12/18-19に熊本大学で開催された情報処理学会 第4回CMS研究会 http://www.ulan.jp/sigcms/ に参加した。
この中で、2日目の招待講演で発表された、国立情報学研究所の高野先生によるGETAという汎用連想計算エンジン(http://geta.ex.nii.ac.jp/ )と、それを応用した「連想する情報サービス」の内容がとても興味深く、印象に残ったので紹介したい。
この計算エンジンは、調べたい内容を文章(自然文)として与えると、その文章に関係の深い単語(特徴語)をキーワード候補として提示してくれる。さらに、入力した文書に類似する文書を検索する「文書連想検索」をやってくれる。
この特徴語を計算するため、例えば、百科事典や書誌情報などの信頼できる文書情報を全文検索にかけ、単語の出現頻度や出現する単語の関係性を表現したWAMと呼ばれる文書と単語のマトリクスにまとめるらしい。
Googleなどで検索を行うとき、与えるキーワードの選定が適切でないと、欲しい情報になかなかヒットせず、直接関係のない情報ばかりが検索さ れることがある。そんなとき、このGETAを応用した検索サービス「Webcat Plus」を組み合わせて使うと、自身の(乏しい)キーワード連想力を補ってくれるんじゃないか?、というわけ。
理屈は何だかとても難しくて、僕もうまく説明できないんだけど、まぁ百聞は一見にしかず、ということで、例えば、私の友人、Moonstar氏が11月18日に書いたブログ「玉名ラーメンスタンプラリー制覇」http://blog.livedoor.jp/hikesub7/archives/50936584.html の全文をコピーし、Webcat Plus (http://webcatplus.nii.ac.jp/)の連想検索にかけてみると、まず検索結果として、ラーメンなどに関係した書籍が843227件検索される。
ここから関連ワードを「ラーメン,食べる,麺,うまい」に絞り込んで、再度検索すると、より関連が強いと考えられる書籍の一覧(全21484件)が得られるし、この関連ワードでググると、
http://www.google.co.jp/search?hl=ja&rls=GGLR%2CGGLR%3A2006-38%2CGGLR%3Aja&q=%E3%83%A9%E3%83%BC%E3%83%A1%E3%83%B3%EF%BC%8C%E9%A3%9F%E3%81%B9%E3%82%8B%EF%BC%8C%E9%BA%BA%EF%BC%8C%E3%81%86%E3%81%BE%E3%81%84&lr=
といった具合に、ブログの内容に関連したウェブサイトを効率よく探し出すことができるというわけだ。結構、いい感じで、的確な情報を選び出してくれるでしょ?
是非、興味のある身近な話題でトライしてみてほしい。

このGETAを応用した「連想する情報サービス」には、他にも「新書マップ」とか「想 -IMAGINE-」などいろいろあって、どれも結構いけてるんじゃないかと思うので、これからいろいろやってみて、面白い使い方があれば、また紹介してみたいと思う。

0 コメント: