y-matsui::weblog

電子楽器、音楽、コンピュータ、プログラミング、雑感。面倒くさいオヤジの独り言

全文検索システムのためのインタフェースについて

タグクラウドで表示する単語が、単語間の関連ベクトル値で近かったり遠かったりしたら良さげだなぁと、なんとなく思っている。
そこで、現在熱いまなざしを向けているのが、自動的に自分の配置を決定する”自己組織化マップ”という可視化手法。
自己組織化マップ化どうかは知らないが、商用製品では、QuickSolutionPortalの可視化機能オプションが似たようなことを実現している。検索結果文書で、単語間のつながりを3次元の球体とノードで表現している。
自己組織化マップを使った多次元データの2次元化(折りたたみ)を使って、タグクラウドで表現できれば、HTMLでも十分に表現できる。タグクラウド上の任意の単語をクリックすると、その単語との関連でタグクラウドが単語がソートされ、同時に全文検索条件のキーワードフィールドにAND条件として入っていけばどうなのかと。
タグクラウドで使用するための単語データは、文書件名を形態素解析したものでどうだ。文書全テキストをマイニングできれば良いのだろうが、必要なマシンパワーの想像がつかない。