HTMLのtableを便利に扱えるモジュールは無いものか、と思って探してみるとこんなものが。
HTML::TableExtract - Perl module for extracting the content contained in tables within an HTML document, either as text or encoded element trees. - metacpan.org
use strict; use warnings; use HTML::TableExtract; my $file = shift; my $parser = HTML::TableExtract->new; $parser->parse_file($file)->tables_dump(1);
これは簡単ですなあ。PODの解説が丁寧で分かりやすい。