形態素解析を検索システムで使う”面白さ”に魅入られている。
自動要約や自動キーワード付与、コンテンツごとのタグクラウド生成に必須の技術だからだ。
Web経由でテキストを渡してやり、品詞分解された単語だけを返すWebサービスができたら、色んなプログラムから呼び出して使える。
今のところ、Webスクリプトにバインド可能な形態素解析エンジンは以下。
Mecab
perl, ruby, python, Javaの例が載っている。Windows上のPerlでも実現できるのかしらん?
KAKASI
perl、rubyに対応。
JUMAN
ダウンロードしたmanual.pdf内にperlからの利用や、JUMANサーバなんていう仕組みがあることが書かれている。”JUMANを試してみる”のページが、今回欲しいものに近い
テキストをPOSTされたときに、XMLかJSONでクライアント側プログラム(登録フォーム)に分かち書きしたテキストを格納するajaxプログラムだったら最高。