寺沢憲吾助教開発の「文書画像検察システム」を公開しました

寺沢憲吾助教開発の「文書画像検索システム」公開

 

本学情報アーキテクチャ学科の寺沢憲吾助教が開発した「文書画像検索システム」について、函館市中央図書館の協力により、下記により公開いたします。

公開開始日: 平成23年5月25日
公開場所URLhttp://records.c.fun.ac.jp/

(函館市中央図書館デジタル資料館 http://www.lib-hkd.jp/digital/ からもリンクを設定します。)

 

文書画像検索システムについて

文書画像検索システムは、スキャナで取り込んだ画像形式の文書画像の中から、指定したキーワードを自由自在に検索できるシステムです。
文字認識に基づく従来の検索システムとは異なり、画像のままで検索を行うため、古文書や古資料のような文字認識が難しい文書にも適用できるという利点があります。
現在のところ、函館市中央図書館所蔵の文献の中から、「亜国来使記」(1854年4月 ペリーが箱館訪問した際の松前藩の応接記録)および「函館新聞」(北海道で最初の民間新聞・明治11年~明治31年発行)のうち明治14年の1年分が利用可能です。

 

成果の内容・特徴

通常、テキスト情報に基づかない画像検索は、精度を高くしようとすればするほど検索時間が莫大になってしまいます。
本システムでは、文書という画像の特性を検索システムに反映させることで、高速な検索を可能としています。

(参考)本システムでの検索時間
「亜国来使記」184ページ(手書き約2万5千字)からの検索: 5~6秒程度
「函館新聞」半年分336ページ(活字約82万字)からの検索: 20~25秒程度

更新 2011/05/30