y-matsui::weblog

電子楽器、音楽、コンピュータ、プログラミング、雑感。面倒くさいオヤジの独り言

形態素解析をWebスクリプトで実行したい

形態素解析を検索システムで使う”面白さ”に魅入られている。
自動要約や自動キーワード付与、コンテンツごとのタグクラウド生成に必須の技術だからだ。
Web経由でテキストを渡してやり、品詞分解された単語だけを返すWebサービスができたら、色んなプログラムから呼び出して使える。
今のところ、Webスクリプトにバインド可能な形態素解析エンジンは以下。
Mecab
perl, ruby, python, Javaの例が載っている。Windows上のPerlでも実現できるのかしらん?
KAKASI
perlrubyに対応。
JUMAN
ダウンロードしたmanual.pdf内にperlからの利用や、JUMANサーバなんていう仕組みがあることが書かれている。”JUMANを試してみる”のページが、今回欲しいものに近い
テキストをPOSTされたときに、XMLJSONでクライアント側プログラム(登録フォーム)に分かち書きしたテキストを格納するajaxプログラムだったら最高。