キーワード抽出モジュールを作ってみたにこんな感じの完璧なキーワード抽出ツールが提示されていた。
ChaSenをPerlのCGIで動かしているようだ。
自分のblogの記事や、googleニュースの記事を貼り付けて、キーワード抽出してみたが、これが素晴らしい結果を出してくる。
「これこれ!これが欲しいのよ」
テキストエリアに書いた本文を、キーワードに分割して、区切り文字付きでテキストフィールドに保存する。品詞情報や重み係数なんかも残しておくのかな。
そこからワード単位のレコードと、ワードとワードの繋がりのレコードを保存すると。
テキストエリアに入力するのは、CSV形式でもいいなぁ。CSVをアップロードできるようにするってのも手だ。
とりあえず、例のごとく、一礼してPerlのファイルを頂戴しちゃおう。
ん?Win32でLingua::JA::Summarizeを使うなんていう気になる情報も。