HTML::TableExtract

HTMLのtableを便利に扱えるモジュールは無いものか、と思って探してみるとこんなものが。
HTML::TableExtract - Perl module for extracting the content contained in tables within an HTML document, either as text or encoded element trees. - metacpan.org

use strict;
use warnings;
use HTML::TableExtract;

my $file   = shift;
my $parser = HTML::TableExtract->new;

$parser->parse_file($file)->tables_dump(1);

これは簡単ですなあ。PODの解説が丁寧で分かりやすい。