y-matsui::weblog

電子楽器、音楽、コンピュータ、プログラミング、雑感。面倒くさいオヤジの独り言

音声、映像検索技術

音声、映像からテキストを抽出して、全文検索しちゃう技術が、そろそろ本当に実現されちゃうかもしれない・・っていうネタ。
基本的に、GoogleとかYouTubeとかWebサービスなんだけど、中には、字幕をテキスト化するなんていうものもある。ビデオのタイトルとか字幕を付けておけば、検索用のテキストデータを取り出せるってのはありがたい。
打ち消し部分の説明→
字幕をOCRのようにテキスト化する云々は、どうやら妄想だったらしい。字幕データが埋め込まれたDVDからテキスト部分を抽出して、字幕データを作成するためのツールという表現が正しい。しかも作成した字幕ファイルを動画とマージするためには別のツールが必要で、字幕ファイルを検索して動画の該当部分を表示できるような検索システムも無い。

Googleの動画から会話をテキスト化する技術が大統領選挙に活かされている
SubRip+日本語化 : 字幕付きDVDから字幕を読み取りテキストに保存
音声情報検索システム『Podcastle』が一般公開し、実証実験を開始
[日本] 音声認識全文検索エンジン「podcastle」
YouTubeをテキストで検索できる『Google Audio Indexing』