Hyper Estraierでインデックス作成にかかる時間

まずは普通のテキストファイル(HTML)に対してインデックス作成する。

real    24m35.857s
user    0m0.031s
sys     0m0.093s
$ estcmd inform casket
number of documents: 100173
number of words: 277814
number of keywords: 0
file size: 442954729
inode number: 22152
attribute indexes:
known options:

10万文書で30分か。早いなー。続いて、PDFとかWordとかの文書をインデックスに追加する。

real    15m22.559s
user    0m0.015s
sys     0m0.124s
$ estcmd inform casket
number of documents: 101487
number of words: 452458
number of keywords: 0
file size: 487138174
inode number: 22152
attribute indexes:
known options:

引き算して1000ちょいの文書で15分。やっぱり遅い。ファイルサイズの大きさと、変換のオーバーヘッドが大きいんだろうな。それでも早いと言えば早いか。