2010-07-01から1ヶ月間の記事一覧

はてなブックマークが「Twitterへ投稿」チェックボックスのON -> OFF を Cookie に保存してくれない件

この話。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.com/widgets.js"; …

Cygwinのls -lで文字化けする話

以前、いきなりCygwinがUTF-8環境になって何だこりゃって思ったことがあったのですが、どうやらWindowsではなくcygwin1.dll 1.7以降の変更が原因らしいです。 合併のお知らせ|OKIソフトウェア そっちかーということで、LANG=ja_JP.SJIS の設定をcygterm.cfg…

Web::Scraperのscraperコマンドのサブコマンド

冗長なタイトルだなあ・・・。 d, y, s, q, c, c all というのがあるらしいです。いつも忘れるので。 sub run_loop { my($tree, $term) = @_; while (defined(my $in = $term->readline("scraper> "))) { if ($in eq 'd') { $Data::Dumper::Indent = 1; warn…

ひびちからじおの更新をチェックするですよー

最初はお手軽にwgetでヘッダー情報を取ってくるとか中身をdiffすればいいとか考えたんだけど、どうもそれだけでは不十分のようで、結局スクレイピングすることに。 use strict; use warnings; use Web::Scraper; use URI; use Win32; use utf8; binmode STDO…

animate.tvのscrape

今日だけじゃなくて明日のために。 process '//table[@class="playlist"]', 'content[]' => scraper{ process '//tr[1]', 'title' => 'TEXT', process '//tr[3]/td[1]', subtitle => 'TEXT', process '//tr[3]/td[@class="play_btn"]/a', 'play' => '@href',…

animate.tvのscrape (2)

use strict; use warnings; use WWW::Mechanize; use Web::Scraper; use XML::LibXML::Simple; #use Path::Class; use Encode; use utf8; binmode STDOUT, ":utf8"; my $uri = shift || die; print STDERR "get $uri ... \n"; my $info = scraper{ process '…

こういうことをしていいのか分からないのだけど・・・

イメージ的には、rlibの下に適当な.pmファイルをおいておけば、それぞれの.pm内部に書かれた正規表現にマッチしているモジュールを使うような。例えばanimate.tvとlantis-netで別々のクローラーを使いたいけど、メインのスクリプトをいじらずモジュールをフ…

結構いい所ついてると思うのですが

793 名前:声の出演:名無しさん[sage] 投稿日:2010/07/17(土) 00:45:06 id:Xz23dZuC0 未ブレイク組 所属事務所 青二:三上枝織 エース:合田彩 81:植竹香菜 アイム:巽悠衣子 アップフロント系:三澤紗千香・石原夏織 バオバブ:金元寿子 ホーリーピーク…

ファイル名の途中からのnumeric sort

とりあえずこんなかんじで。sortコマンドのポジション指定は1-originなんだって。 $ ls file*.txt | sort -k 1.5 -n file0.txt file1.txt file2.txt file3.txt file4.txt file5.txt file6.txt file7.txt file8.txt file9.txt file10.txt file11.txt file12.t…