y-matsui::weblog

電子楽器、音楽、コンピュータ、プログラミング、雑感。面倒くさいオヤジの独り言

GoogleMiniが気になる

GoogleMiniが4月にパワーアップした。
検索アプライアンスなんて”ホームユースで買うもの”では全然ないんだけども。
扱える文書数が10万件以上、対応データフォーマット220種類。価格はなんと!3000ドル程度。
33万円程度のお金でマイGoogleが手に入っちゃうってのはなんか楽しい。
いやいや、企業のナレッジマネージメント(古!)とかASPサービスとかで使う”完全なSIツール”の話ですが。
nucleus CMSのGoogleITと組み合わせて、なんか面白そうな使い方ができそう。

近年は、色んな企業で団塊の世代のノウハウをどのように後世に残すか・・といった話題が良く聞かれる。
某鉄道会社や某重工業メーカーなんかでも、かなり真剣に取り組んでいる。
”ナレッジベース”とか”ナレッジポータル”なんてバタくさい言い方でIT業界も色めき立ってたりして。
その企業独自の用語集であったり、eラーニングコンテンツだったり、標準作業書みたいなものだったりするのかな。
要するに、ハイパーリンクディレクトリと全文検索なんだけども、wikipediaみたいな形で、企業内の技術伝承をできたらいいなぁという話なのである。ただ、wikiを企業で使おうとすると、すべてをwikiスタイルで書き直すわけには行かないし、文法も特殊なのでおおっぴらにお勧めする内容でもない。
既存の文書データの取り込みはどうするの?っていう話は避けられない。

「10万ページの調査報告書をすべてOCRテキスト付きのPDFに変換して、整理して、ナレッジベースにしたい!」という具体的なニーズに対して、色々と提案に思いをめぐらせている中、「GoogleMiniを検索エンジンとして使っちゃおうか」と思い立った次第。
・・・で全文検索のインタフェースだけじゃちょっと不親切なんで、ユーザーが一番最初に見るポータル画面はnucleusのようなCMSで構築して、階層検索や目次やハイパーリンクによるナビゲーションを・・と。
一人一人にblogを作成して、カテゴリもその人独自のもの。記事を書いていく要領で、技術的な内容を書いていき、文中の単語はリンクしたい単語という記述をすると、GoogleMiniに検索条件を渡すアンカーが生成される。
NAS(ファイルサーバー)内に蓄積された膨大な資料がダイレクトに検索されて表示される。
これって、凄いことだと思う。Wikiで言うところのInterWikiNameのGoogleMini版。
この仕組みをなんとかモノにしたいなぁと考えている。