y-matsui::weblog

電子楽器、音楽、コンピュータ、プログラミング、雑感。面倒くさいオヤジの独り言

2006-01-01から1年間の記事一覧

NetSHAKER BlueRackの後継バージョン

CobaltRaQの後継としてデビューした、安川情報システム?のBlueRack。 コバルトブルーが原色の”青”になって、がっかりしたものだが、今回後継機種であるNAHP143Z(BlueRack ver.1.2)になって、更にがっかり。 真っ黒で2U・1/2幅の無骨なデザイン。 「しかし…

祭られた人々

2ちゃんねるを舞台に勃発した”祭り”の年表。 自分はほとんど2chを見ないので、祭りをリアルタイムで体験したことはないが、最近では、2ちゃんねらーの低年齢化が進み、揚げ足取り的、”集団リンチ的”なイジメが度々発生するらしい。 本の中身を読んでみると、…

Web2.0が殺すもの/宮脇睦

最近、書店に溢れかえるWeb2.0本の中でも、珍しく批判的なスタンスで書かれた本書を発見。 特筆すべきデータや視点が提示されるわけではなく、「既存の商売が喰われちゃったりすることはないし」、「あちら側よりもこちら側でしょ」、「ちょっと楽観的すぎや…

Javascriptで形態素解析

MeCabなどの形態素解析器を使わず、正規表現とあらかじめテーブル化した助詞だけで品詞分解するJavascriptプログラムを発見。 ■[JavaScript]ボキャブラリ解析ツールに解説されているボキャブラリ解析ツール 形態素解析もどきを改良してみたと形態素解析もど…

キーワードマップ

キーワードマップ(IE,FireFox)が出来てきた。 辞書登録ツール(簡易形態素解析&登録)はこちら 一度に30個以上の単語を表示させると、CPUパワーが100に張り付いてしまうなどの問題(汗)があるものの、一応所望の結果ということで、とりあえず公開しちゃう…

自動抽出した特徴キーワードで自己組織化タグクラウド(ワードマップ)

Lingua-JA-Summerize-0.06のShift-JIS動作で、俄然勢いに乗るサラリーマン1人。 今度は、データベースに単語レコードと、単語と単語のつながりレコードを保存し、自己組織化するタグクラウドとして表現してみる。Make_Keyword.cgi テキストエリアにペースト…

Lingua-JA-Summerize-0.06のShift_JIS動作

Lingua-JA-Summerize-0.06のShift_JIS表示および他スクリプトへのPOSTに成功。 Lingua-JA-Summerize-0.06が、euc以外の指定を出来るようになっているので、内部エンコーディング、mecabエンコーディングともにsjisを指定。cgiをsjisで保存し直して、encodeHT…

特徴キーワードの精度を調査してみた

Lingua-JA-Summerize-0.06による自動キーワード抽出で、文書から特徴キーワードを抽出できることは分かったが、それなら「特徴キーワードから、適切に文書を絞り込めるのか?」気になるではないか。 早速、news.google.co.jpの記事を無作為に選んで、抽出し…

Lingua-JA-Summerize-0.06による自動キーワード抽出

Windows2000,ActivePerl環境で、Lingua-JA-Summerize-0.06が動いた! Lingua-JA-Summerize-0.06で、抽出した単語を、aspプログラムにポストして、受信するところまでは確認が出来た。 今後(明日かな?)は、euc-jpでポストされた文字をasp側でshift-jisなど…

ブックオフの買取り価格ひどすぎ

自分は、大量の本を消費する。すぐに本棚が溢れてしまう。 ・・で多少愛着はあるものの、思い切って売ってしまおうと。 店員の妙なテンションが少々気になるブックオフで売ってみた。 これがひどい。 新刊で、売上票が挟んであるくらいのハードカバー、定価1…

ヒミズ/古谷実

少し前に読んだ、ニッポン問題/M2で、宮崎哲弥氏が絶賛していた漫画ヒミズを古本屋で購入。 一気に1-4巻まで読む。2回も読む。 宮崎哲弥氏が言っていた通り、人間存在(実存)をディープに抉った、ハードな内容だ。「普通の生活の難しさ」「あまっちゃろいご…

続 エンタープライズサーチ

先の”エンタープライズサーチの売り文句”が「ほんとかいな?」と気になっていたので、さらに調べてみた。 まず、エンタープライズサーチというジャンル(情報ポータルとかナレッジベースの焼き直し?)が再燃したきっかけが、2005年1月のGoogle検索アプライ…

GoogleMiniのインタフェースカスタマイズ

GoogleMiniは、Googleそっくりだ。当たり前だ。 しかし、インタフェースが物足りない。汎用的な設計が素晴らしいのであるが、どうしてもフォルダツリーメニューや、グラフィカルな検索が出来る方が良い。 素晴らしいことに、GoogleMiniは、RESTで設計されて…

エンタープライズサーチの売り文句ってどうなの?

アットマークITに"イントラネットの夜明けエンタープライズサーチ"という記事があった。 業界からのスローガンなので、少し差し引いて判断する必要があると思うが、以下の主張は、なかなか挑発的で魅力的である。エンタープライズサーチの必要性を説得するデ…

全文検索キーワードの決定に形態素解析を役立てる

全文検索のキーワード選択は、結構難しい。 どこような単語が使われているかを、想像できれば的確な結果が得られるが、そうでない場合は多くのページを目で見て判断する必要がある。複数の単語を指定することにより、より絞り込めるようになっているものの、…

Fallen / Evanescence

エヴァネッセンスの1st こちらのアルバムは、ヴォーカルが宇多田ヒカルに聴こえる部分があり、楽曲自体もずいぶんと聴きやすい。なるほど1500万枚も売れるんだからね。 どれも曲調は暗く、ヒステリック、焦燥感、迷い、葛藤がアリアリ。全曲似ていて、アルバ…

Corrupting Redemption / d.fRost

へヴィロックコーナの視聴機で耳に止まった一品。ここに唯一の情報源が。 ”サンディエゴ・ロックの革命児、日本上陸!”って言われても、サンディエゴ・ロックなんていうのを聞いたこともなければ、ロックに革命っていう文句も良く言われる話なのである。 ロ…

The Open Door / Evanescence

”歌姫系へヴィロック”バンドエヴァネッセンスの2nd。本日発売。 店内で掛かっていたのを「今、かかってるの何?」と即買い。視聴機で、5曲程度チェックしたが、どれも大袈裟で悲しげで、ヒステリックで、美しい。 アルバムを通して聴く中で、「ん?ちょっと○…

懲りずに・・「みんなの意見」は案外正しい

・行き過ぎた権威(専門家)依存への”健全な”ゆり戻しとの指摘←ジャーナリスト ・”みんなの意見”=新しい権威を商売に繋げたいというIT企業の新サービス←Web2.0 ・真の民主主義=完全な機会平等を広めたいとの政治的活動←ネット民主主義 ・純粋に集合論、集…

まだまだ、「みんなの意見」は案外正しいネタ

まだ言い足りない「みんなの意見」は案外正しいに関するネタ 魅力的なテーマでもあり、言葉が独り歩きしがちなテーマであるからこそ、言い足りない感じが残っている。フォークソノミーやblogってそもそも、みんなの意見を大事にする仕組みだし、共起語を判定…

「みんなの意見」は案外正しい?

みんなの意見が、専門家の意見よりも優れる”場合がある”というアイディアが結構有名だ。 しかし、これ大事な前提があって、多様性、独立性、分散性がある集団である必要がある。 かつ、”予想に役立てる情報”と限定する必要もあるかもしれない。エキスパート…

グーグル・アマゾン化する社会 /森健

多様化、個人化、フラット化した世界で、なぜ一極集中が起きるのか?気鋭のジャーナリストが、ネット社会の矛盾に斬り込む。 amazonの商品紹介 グーグルやアマゾンを事例に挙げているが、この本が他のWeb2.0本と違うのは”複雑系ネットワーク”の知識を絡めてい…

スクリプトからバーコード付きのPDF帳票を生成してみる

FDFを使って、WebスクリプトからPDF帳票を生成する・・・を以前、PHPのインターネットアプリでやったことがあるが、今回は、イントラネットのASPアプリでやってみる。そう、いつぞやの文書・図面管理システムの追加機能として。情報をDBとファイルシステムで…

MeCabをPHPから使う・・・の情報など

PHPから使えると何かと便利ってことで MeCab PHP extension moduleを使ってみた MeCabで形態素解析した結果をタグクラウドにする MeCab - HTML::TagCloud そのPerlソース ほえー、こんなのあったんだ HTML::TagCloud

下流喰い〜消費者金融の実態/須田慎一郎

常々気になっていること”消費者金融”について 悪魔のビジネス・モデルと歯に衣を着せないモノ言いをしている新書を発見。 早速購入して、目を通してみると・・・ これがまぁ、呆れるほどの実態になっちゃってるわけです 全就業人口の1/4にあたる2000万人がサ…

フリーの全文検索システム”Hyper Estraier”って凄い

名前だけ聞いた事があった”HyperEstraier”っていう全文検索システム、これ、よくよく読んでみると凄いシステムであることが判明。・・・って知らなかったアタシが馬鹿ってだけなんだけど。 形態素解析とN-gramのハイブリッドで、類似文書検索ができて、関連…

ActivePerlでLingua-JA-Summarize-0.06 を動かす

ActivePerlでLingua-JA-Summarize-0.06 を動かすまでの作業履歴。 ■手順 ・ActivePerlをインストールする ・Perlのパスが通っているかどうかを確認する。 ・IISでplやcgiの実行が可能なように構成する。 ・MeCabのWindows版をインストールする ・MeCabのPerl…

サイボウズラボにキーワード抽出のサンプルが

キーワード抽出モジュールを作ってみたにこんな感じの完璧なキーワード抽出ツールが提示されていた。 ChaSenをPerlのCGIで動かしているようだ。 自分のblogの記事や、googleニュースの記事を貼り付けて、キーワード抽出してみたが、これが素晴らしい結果を出…

IISでPerl

KAKASIとかJUMANを使って、形態素解析をしたいので、開発用サーバ(Windows2003)にActivePerlを入れた。 IISでPerl CGIを動かすには?を参考にして、IISの初期設定をしたが、一緒にインストールされたbenchmarkのプログラムが動作しない。IIS 6.0のWeb拡張…

自己組織化するタグクラウドの実現に向けて(設計・・・らしきもの)

JoltMarkみたいなタグクラウド(意味ネットワーク)を構築する場合の手順(設計らしきもの)をメモしてみる。 ■システムイメージ 登録時処理 ・文書登録時・保存時に件名やコメント欄などの自由文を”形態素解析” ・形態素解析した結果(単語、単語間のつなが…