2012-01-01から1年間の記事一覧

Wikipediaから声優名一覧を取ってくるPerlスクリプトv3

最新のコードを貼っておきましょう。便宜上スクレイピングするコードを残してありますが、できればダンプデータを使った方がよいと思います。 Wikipediaに怒られない方法でWikipediaの女性声優リストを作成する - XXXannex

Wikipediaに怒られない方法でWikipediaの女性声優リストを作成する

以前は女性声優名のリストを作成するためにWikipediaのデータをスクレイピングする方法を取っていましたが、Wikipedia的にはクローラの使用は歓迎されていないようです。 Wikipediaから声優名一覧を取ってくるPerlスクリプト - XXXannex 記事を大量にダウン…

シェル操作課題 (cut, sort, uniq などで集計を行う) 設問編 を解いてみた

シェル操作課題 (cut, sort, uniq などで集計を行う) 設問編 - Yamashiro0217の日記何となく暇だったので。 UNIXのテキスト操作系コマンドは非常に便利なので使いこなせると捗る。 問題の性質上、凝った解き方やログファイルの内容に依存した解き方ではなく…

やー

それにしても、今月頭くらいに初めて西瓜babyのpv見た時は「こんなん誰が誰だか分かんねーよ!」って思ってたもんだけど、今見てみると最初のカットですぐ分かる。で、区別が付くようになると、顔が同じとか言ってる人の意味が分からんって気持ちになってく…

そういえば

アカウントが消えたからページも消えるんだろうなーと思ってスクリーンショットを取っておいたのを今思い出した。 「そう言えば」ついでに、すっかり忘れてたのでメモしておくと、むかし増田で釣りエントリー書いたら予想通りに釣れてうわーチョロすぎるわー…

chromeでHTTPリクエストのヘッダーを見る

chrome://net-internals/#events にアクセスして URL_REQUEST でフィルターするとよい。が、ヘッダーは見れるがmethod=POSTの時はデータが見れないな。しゃーなしだ。

声優がはてなキーワードに登録された順番

何となく調べてみました。上から50人。キーワードのデータはこちらから。はてなキーワード一覧ファイル - Hatena Developer Center 順番 名前 KID 登録日 1 金田朋子 811 2003/02/20 2 水樹奈々 820 2003/02/11 3 野川さくら 1517 2003/04/20 4 田村ゆかり 1…

声優リスト

https://docs.google.com/spreadsheet/pub?key=0AtjBs4lEumHVdFZrUzRaYmFRYzhtdlNTSTRtbVZKd2c&output=html随時アップデートしていこうと思います。output= をtxtとかcsvとか変えると色々なフォーマットでダウンロードできます。データについてはこの辺をマ…

試しに

少し昔に流行したマルコフ連鎖で文章を作る話、ちょっと気になってざっくり作ってみた。 どっかから文章をクロールしてくる MeCabとかで形態素解析 マルコフ連鎖を作る 組み合わせる 今回はDMM.R18のレビューから適当にコピーしてきた。形態素解析したものか…

R: 生 & 死 == 愛

R

404 Blog Not Found:perl: 生 & 死 == 愛 > life <- enc2utf8("生") > death <- enc2utf8("死") > intToUtf8(sum(as.integer(intToBits(utf8ToInt(life)) & intToBits(utf8ToInt(death))) * 2^(0:31))) [1] "愛" ・・・・・・長すぎる。

はてなブックマークボタンが行動情報の取得をしている、という話

この辺の話でしょうか。 はてなブックマークボタンは2011年9月1日より行動情報の取得をしている - ARTIFACT@ハテナ系 はてなブックマークボタンを表示する - はてなブックマークヘルプ はてなブックマークボタンの作成・設置について マイクロアド版とオプト…

ppi

ppi <- function(h, v, inch) sqrt(h^2+v^2)/inch > ppi(960,640,3.5) [1] 329.6504 > ppi(1280,720,4.3) [1] 341.536 追記 どういう式なんだろう?って思ってたけど、なるほど、三平方の定理!

Growlで通知するTeratermマクロ作れよ、色々と捗るぞ

例えば超時間のかかるコマンドを実行してて、終わったら通知して欲しい、みたいな。 wait '$' '#' gethostname host sprintf2 cmd '<path to growlnotify> /i:"<path to icon>" "command finished on %s"' host exec cmd表示画面はもっと凝ったことができそうだけど、とりあえず通知してくれさえ</path></path>…

昨日のコード

某グラの某データ - XXXannexあまり表立って公開するのもよろしくない気がしなくもない。 use strict; use warnings; use URI; use Web::Scraper; use List::MoreUtils qw/uniq/; use utf8; binmode STDOUT, ':utf8'; my @table_kw = qw(a ka sa ta na ha ma…

某グラの某データ

最近、声優統計の皆様が色々とすごい解析をされててすごいです。自分も何かせねば・・・ということで、とりあえずデータのクロールでもしておくか、と思ってやってみました。http://seigura.com/senior/directory/tabid/69/Default.aspx声優統計における最初…

Growl for windows はAlt-x と Alt-Shift-x をホットキーに割り当てるのでemacs(xyzzy)ユーザーは注意しましょう

emacsユーザーが大好きなAlt-xキー。私はxyzzyですが、突然Alt-x(M-x)の反応が無くなって焦りました。どうやら原因はGrowl for windowsが自動的にAlt-x と Alt-Shift-xをグローバルなホットキーに割り当ててしまうせいのようです。超余計なお世話。対策とし…

変数を正規表現の中で使いたいけど変数自体に正規表現が入ってる話

こういう話。 use strict; use warnings; use utf8; binmode STDOUT, ':utf8'; my $name = 'アマガミSS+ plus'; my $title = '[アニメ][0642] アマガミSS+ plus 第01話「絢辻詞編 前編 ユウワク」'; print $title =~ /$name.+(\d+)/ ? 'matched' : 'unmatche…