y-matsui::weblog

電子楽器、音楽、コンピュータ、プログラミング、雑感。面倒くさいオヤジの独り言

Lingua-JA-Summerize-0.06による自動キーワード抽出

Windows2000,ActivePerl環境で、Lingua-JA-Summerize-0.06が動いた!
Lingua-JA-Summerize-0.06で、抽出した単語を、aspプログラムにポストして、受信するところまでは確認が出来た。
makekeyword.gif
今後(明日かな?)は、euc-jpでポストされた文字をasp側でshift-jisなどに変換、配列を分解して、DBに保存する処理を作る。例の、キーワードをtbl_wordで検索して、上書き・カウントアップ・格納するのと、語と語の繋がりをノードデータとしてtbl_nodeに格納する。
それが出来れば、文章を吸い込ませて自動的に特徴キーワードを抜き出し、自己組織化タグクラウドのインタフェースを生成することが出来る。
よし!燃えてきたぞ