2006-01-01から1年間の記事一覧
CobaltRaQの後継としてデビューした、安川情報システム?のBlueRack。 コバルトブルーが原色の”青”になって、がっかりしたものだが、今回後継機種であるNAHP143Z(BlueRack ver.1.2)になって、更にがっかり。 真っ黒で2U・1/2幅の無骨なデザイン。 「しかし…
2ちゃんねるを舞台に勃発した”祭り”の年表。 自分はほとんど2chを見ないので、祭りをリアルタイムで体験したことはないが、最近では、2ちゃんねらーの低年齢化が進み、揚げ足取り的、”集団リンチ的”なイジメが度々発生するらしい。 本の中身を読んでみると、…
最近、書店に溢れかえるWeb2.0本の中でも、珍しく批判的なスタンスで書かれた本書を発見。 特筆すべきデータや視点が提示されるわけではなく、「既存の商売が喰われちゃったりすることはないし」、「あちら側よりもこちら側でしょ」、「ちょっと楽観的すぎや…
MeCabなどの形態素解析器を使わず、正規表現とあらかじめテーブル化した助詞だけで品詞分解するJavascriptプログラムを発見。 ■[JavaScript]ボキャブラリ解析ツールに解説されているボキャブラリ解析ツール 形態素解析もどきを改良してみたと形態素解析もど…
キーワードマップ(IE,FireFox)が出来てきた。 辞書登録ツール(簡易形態素解析&登録)はこちら 一度に30個以上の単語を表示させると、CPUパワーが100に張り付いてしまうなどの問題(汗)があるものの、一応所望の結果ということで、とりあえず公開しちゃう…
Lingua-JA-Summerize-0.06のShift-JIS動作で、俄然勢いに乗るサラリーマン1人。 今度は、データベースに単語レコードと、単語と単語のつながりレコードを保存し、自己組織化するタグクラウドとして表現してみる。Make_Keyword.cgi テキストエリアにペースト…
Lingua-JA-Summerize-0.06のShift_JIS表示および他スクリプトへのPOSTに成功。 Lingua-JA-Summerize-0.06が、euc以外の指定を出来るようになっているので、内部エンコーディング、mecabエンコーディングともにsjisを指定。cgiをsjisで保存し直して、encodeHT…
Lingua-JA-Summerize-0.06による自動キーワード抽出で、文書から特徴キーワードを抽出できることは分かったが、それなら「特徴キーワードから、適切に文書を絞り込めるのか?」気になるではないか。 早速、news.google.co.jpの記事を無作為に選んで、抽出し…
Windows2000,ActivePerl環境で、Lingua-JA-Summerize-0.06が動いた! Lingua-JA-Summerize-0.06で、抽出した単語を、aspプログラムにポストして、受信するところまでは確認が出来た。 今後(明日かな?)は、euc-jpでポストされた文字をasp側でshift-jisなど…
自分は、大量の本を消費する。すぐに本棚が溢れてしまう。 ・・で多少愛着はあるものの、思い切って売ってしまおうと。 店員の妙なテンションが少々気になるブックオフで売ってみた。 これがひどい。 新刊で、売上票が挟んであるくらいのハードカバー、定価1…
少し前に読んだ、ニッポン問題/M2で、宮崎哲弥氏が絶賛していた漫画ヒミズを古本屋で購入。 一気に1-4巻まで読む。2回も読む。 宮崎哲弥氏が言っていた通り、人間存在(実存)をディープに抉った、ハードな内容だ。「普通の生活の難しさ」「あまっちゃろいご…
先の”エンタープライズサーチの売り文句”が「ほんとかいな?」と気になっていたので、さらに調べてみた。 まず、エンタープライズサーチというジャンル(情報ポータルとかナレッジベースの焼き直し?)が再燃したきっかけが、2005年1月のGoogle検索アプライ…
GoogleMiniは、Googleそっくりだ。当たり前だ。 しかし、インタフェースが物足りない。汎用的な設計が素晴らしいのであるが、どうしてもフォルダツリーメニューや、グラフィカルな検索が出来る方が良い。 素晴らしいことに、GoogleMiniは、RESTで設計されて…
アットマークITに"イントラネットの夜明けエンタープライズサーチ"という記事があった。 業界からのスローガンなので、少し差し引いて判断する必要があると思うが、以下の主張は、なかなか挑発的で魅力的である。エンタープライズサーチの必要性を説得するデ…
全文検索のキーワード選択は、結構難しい。 どこような単語が使われているかを、想像できれば的確な結果が得られるが、そうでない場合は多くのページを目で見て判断する必要がある。複数の単語を指定することにより、より絞り込めるようになっているものの、…
エヴァネッセンスの1st こちらのアルバムは、ヴォーカルが宇多田ヒカルに聴こえる部分があり、楽曲自体もずいぶんと聴きやすい。なるほど1500万枚も売れるんだからね。 どれも曲調は暗く、ヒステリック、焦燥感、迷い、葛藤がアリアリ。全曲似ていて、アルバ…
へヴィロックコーナの視聴機で耳に止まった一品。ここに唯一の情報源が。 ”サンディエゴ・ロックの革命児、日本上陸!”って言われても、サンディエゴ・ロックなんていうのを聞いたこともなければ、ロックに革命っていう文句も良く言われる話なのである。 ロ…
”歌姫系へヴィロック”バンドエヴァネッセンスの2nd。本日発売。 店内で掛かっていたのを「今、かかってるの何?」と即買い。視聴機で、5曲程度チェックしたが、どれも大袈裟で悲しげで、ヒステリックで、美しい。 アルバムを通して聴く中で、「ん?ちょっと○…
・行き過ぎた権威(専門家)依存への”健全な”ゆり戻しとの指摘←ジャーナリスト ・”みんなの意見”=新しい権威を商売に繋げたいというIT企業の新サービス←Web2.0 ・真の民主主義=完全な機会平等を広めたいとの政治的活動←ネット民主主義 ・純粋に集合論、集…
まだ言い足りない「みんなの意見」は案外正しいに関するネタ 魅力的なテーマでもあり、言葉が独り歩きしがちなテーマであるからこそ、言い足りない感じが残っている。フォークソノミーやblogってそもそも、みんなの意見を大事にする仕組みだし、共起語を判定…
みんなの意見が、専門家の意見よりも優れる”場合がある”というアイディアが結構有名だ。 しかし、これ大事な前提があって、多様性、独立性、分散性がある集団である必要がある。 かつ、”予想に役立てる情報”と限定する必要もあるかもしれない。エキスパート…
多様化、個人化、フラット化した世界で、なぜ一極集中が起きるのか?気鋭のジャーナリストが、ネット社会の矛盾に斬り込む。 amazonの商品紹介 グーグルやアマゾンを事例に挙げているが、この本が他のWeb2.0本と違うのは”複雑系ネットワーク”の知識を絡めてい…
FDFを使って、WebスクリプトからPDF帳票を生成する・・・を以前、PHPのインターネットアプリでやったことがあるが、今回は、イントラネットのASPアプリでやってみる。そう、いつぞやの文書・図面管理システムの追加機能として。情報をDBとファイルシステムで…
PHPから使えると何かと便利ってことで MeCab PHP extension moduleを使ってみた MeCabで形態素解析した結果をタグクラウドにする MeCab - HTML::TagCloud そのPerlソース ほえー、こんなのあったんだ HTML::TagCloud
常々気になっていること”消費者金融”について 悪魔のビジネス・モデルと歯に衣を着せないモノ言いをしている新書を発見。 早速購入して、目を通してみると・・・ これがまぁ、呆れるほどの実態になっちゃってるわけです 全就業人口の1/4にあたる2000万人がサ…
名前だけ聞いた事があった”HyperEstraier”っていう全文検索システム、これ、よくよく読んでみると凄いシステムであることが判明。・・・って知らなかったアタシが馬鹿ってだけなんだけど。 形態素解析とN-gramのハイブリッドで、類似文書検索ができて、関連…
ActivePerlでLingua-JA-Summarize-0.06 を動かすまでの作業履歴。 ■手順 ・ActivePerlをインストールする ・Perlのパスが通っているかどうかを確認する。 ・IISでplやcgiの実行が可能なように構成する。 ・MeCabのWindows版をインストールする ・MeCabのPerl…
キーワード抽出モジュールを作ってみたにこんな感じの完璧なキーワード抽出ツールが提示されていた。 ChaSenをPerlのCGIで動かしているようだ。 自分のblogの記事や、googleニュースの記事を貼り付けて、キーワード抽出してみたが、これが素晴らしい結果を出…
KAKASIとかJUMANを使って、形態素解析をしたいので、開発用サーバ(Windows2003)にActivePerlを入れた。 IISでPerl CGIを動かすには?を参考にして、IISの初期設定をしたが、一緒にインストールされたbenchmarkのプログラムが動作しない。IIS 6.0のWeb拡張…
JoltMarkみたいなタグクラウド(意味ネットワーク)を構築する場合の手順(設計らしきもの)をメモしてみる。 ■システムイメージ 登録時処理 ・文書登録時・保存時に件名やコメント欄などの自由文を”形態素解析” ・形態素解析した結果(単語、単語間のつなが…