y-matsui::weblog

電子楽器、音楽、コンピュータ、プログラミング、雑感。面倒くさいオヤジの独り言

HyperEstraier

HyperEstraierで扱えるファイルサイズの拡張

HyperEstraier(estcmd)には、扱えるファイルサイズに制限がかけられている。テキストファイルで128kb、ファイルサイズで32MBというのがデフォルト値。 これは、mp3やmpegを喰わせていた時にestcmd.exe: ERROR: d:\data\sample.mpg: exceeding the file siz…

HyperEstraierの検索結果にキーワードポップアップを追加

HyperEstraierの検索結果一覧で、タイトル部分にポップアップを埋め込み、形態素解析された結果のキーワードをちりばめてみた。何もわざわざポップアップしなくても、単語一覧は、インデックス参照画面で見ることが出来ていたのだが、一覧で見えることで、関…

HyperEstraierの検索結果にアイコンを追加

HyperEstraierの検索結果で、ファイルタイプに応じたアイコンの追加 各種アイコン付きのナイスな一品です。→Iconize Textlinks with CSS estseek.tmplにcssの読み込みを指定するだけの簡単設置。

HyperEstraierでXMLファイルを検索する

XMLを検索したい理由: 1.定型情報(RDBMS)や文書プロパティに格納されたデータの意味を保持したまま、全文検索を行いたい。 →将来、セマンティックWebのデータに流用するためには、属性データを分離、加工可能な状態で保持したい。(フリースタイルのテキ…

HyperEstraierのWindows版をソースからリビルドする

しんどかった。 手順を示してくれる親切なサイトがあっても、たっぷり2日を使ってしまった。 Hyper EstraierのMinGW上での再ビルド ←スペシャルサンクス さらにそのリファレンスである HyperEstraierのビルド Mecab周りで戸惑っていて見つけた情報←サンクス■…

HyperEstraier on Windowsのとんだ回り道

以前のエントリーで> MeCABを使った分かち書き、単語抽出に対応できているのか・・・と知りたかっただけなんだけど。 >コマンドが通ってれば良いっていう話? > 辞書の文字コードとHyperEstraier内部の文字コードの問題って? > とか、色々。 > 自分でやって…

HyperEstraier on Windows の情報

メモ/HyperEstraier(Win32) Hyper Estraier を Windows + Apache2 にインストール WindowsにHyper Estraierをインストール Hyper Estraier on Windows Hyper EstraierをWindowsサービスに登録する方法 MeCABを使った分かち書き、単語抽出に対応できているの…

HyperEstraierのインデックス処理

HyperEstraierを使っていると、インデックスが結構壊れる。repairというコマンドがあるので、まずこれを試してみるのだが、完全に壊れてしまっている場合が結構ある。 壊れると再スキャン、再クロールが必要になり、かなりの時間が無駄になる。何よりもデー…

ネットワーク共有ドライブのマウント

「Windowsに置いたファイルやLinuxのファイルを、LinuxのHyperEstraierで検索したい」 というわがままなお客さんを想定して(今現在は、このわがままなお客さんとは自分のこと)のため、NFSなどの手法を調べてみたところ、NFSを使う方法 smbmountを使う方法 …

HyperEstraierの検索インタフェースを変更

検索画面の英語表記が嫌だったので、estseek.cの英単語を日本語に置き換えた。estseek.c ファイルをutf-8で保存し、リコンパイル。/usr/local/libexec/estseek.cgiを/www/cgi-bin/estseekに上書きして完了。 ・・と思いきや、日本語化して文字数が増えたので…

HyperEstraierの管理コマンド(私家版メモ)

#HyperEstraierのクロールインデックス作成コマンド estwaver init /var/???#HyperEstraierのクロール開始コマンド #クロール前に/var/???/_confの設定変更を行うこと! estwaver crawl /var/???#再開するとき estwaver crawl -revisit /var/??? または estw…

HyperEstraierの関連語表示機能

HyperEstraierを評価している。 前回までのところで、文書フィルタやクローラの設定を完了し、一通りの機能を試すことができたのだが、デモサイトと比べて、「おや?これは」という部分があった。 まず、ジャンルっていうチェックボックス。 インデックス内…

CentOS5.1+HyperEstraier

超迷子: 共同体的全文検索系 全文検索エンジンHyper Estraierを仮想CentOS5.1(5.2)サーバに導入した際のメモ。 HyperEstraierのインストールは、ここを見ながら、意外とすんなり。 あ、libiconv-1.12とQDBM-1.8.77を事前に導入しておく必要がある。 /var/w…

フリーの全文検索システム”Hyper Estraier”って凄い

名前だけ聞いた事があった”HyperEstraier”っていう全文検索システム、これ、よくよく読んでみると凄いシステムであることが判明。・・・って知らなかったアタシが馬鹿ってだけなんだけど。 形態素解析とN-gramのハイブリッドで、類似文書検索ができて、関連…