名前だけ聞いた事があった”HyperEstraier”っていう全文検索システム、これ、よくよく読んでみると凄いシステムであることが判明。・・・って知らなかったアタシが馬鹿ってだけなんだけど。
形態素解析とN-gramのハイブリッドで、類似文書検索ができて、関連語の提示機能まである。
Googleみたいに類似文書の畳み込み表示機能もあれば、Webクローラまで付いている。
文書フィルタやRDBクロール機能なんかが付いてれば、完全に商用システム並み。
セットアップや運用管理は、それなりに手間が掛かりそうなのだが、個人で商用全文検索エンジンを購入するなんてことが望めない以上、こういったツールにどっぷり浸かって、青春を捧げて良いような気がする。