Table of Contents
PDF データの索引化と検索
電子書籍や專門分野に関わる資料のみならず、最近では学術論文が PDF で配布されることも珍しくないので、HDD の中でどんどん肥大化していく PDF データを持て余しているのは私だけではないだろう。先日の記事「Hyper Estraier で仏典探索」で、試みに全文検索システム Hyper Estraier を用いてローカルに保存されているテキストファイルを検索してみたが、この全文検索システム は PDF 文書の検索にも対応しているので、その検索も任せてみる。なお、以下は 前回 に引き続き Mac OS X 10.6.8 上で、 Macports を用いて Hyper Estraier をインストール (/opt/local/bin/estcmd) した上で作業を行っている。