まずは普通のテキストファイル(HTML)に対してインデックス作成する。
real 24m35.857s user 0m0.031s sys 0m0.093s
$ estcmd inform casket number of documents: 100173 number of words: 277814 number of keywords: 0 file size: 442954729 inode number: 22152 attribute indexes: known options:
10万文書で30分か。早いなー。続いて、PDFとかWordとかの文書をインデックスに追加する。
real 15m22.559s user 0m0.015s sys 0m0.124s
$ estcmd inform casket number of documents: 101487 number of words: 452458 number of keywords: 0 file size: 487138174 inode number: 22152 attribute indexes: known options:
引き算して1000ちょいの文書で15分。やっぱり遅い。ファイルサイズの大きさと、変換のオーバーヘッドが大きいんだろうな。それでも早いと言えば早いか。