y-matsui::weblog

電子楽器、音楽、コンピュータ、プログラミング、雑感。面倒くさいオヤジの独り言

サイボウズラボにキーワード抽出のサンプルが

キーワード抽出モジュールを作ってみたこんな感じの完璧なキーワード抽出ツールが提示されていた。
ChaSenPerlCGIで動かしているようだ。
自分のblogの記事や、googleニュースの記事を貼り付けて、キーワード抽出してみたが、これが素晴らしい結果を出してくる
「これこれ!これが欲しいのよ」
テキストエリアに書いた本文を、キーワードに分割して、区切り文字付きでテキストフィールドに保存する。品詞情報や重み係数なんかも残しておくのかな。
そこからワード単位のレコードと、ワードとワードの繋がりのレコードを保存すると。
テキストエリアに入力するのは、CSV形式でもいいなぁ。CSVをアップロードできるようにするってのも手だ。
とりあえず、例のごとく、一礼してPerlのファイルを頂戴しちゃおう。
ん?Win32でLingua::JA::Summarizeを使うなんていう気になる情報も。