2009-01-01から1ヶ月間の記事一覧

メモ

キーワードによる「つながり」を可視化しているという意味でも調査を継続している価値はあったか。

2008年声優言及数 作業メモ(4) データの解析 の続き

続いて、本来の目的である個人ベースの言及数の解析に入ります。こんな感じのスクリプトで解析してみることにします。 data.stat <- function(d, pickup=seq_len(ncol(d))){ d <- d[,pickup] lm.ba <- apply(d, 1, function(v) lm(as.numeric(v) ~ pickup)[[…

2008年声優言及数 作業メモ(4) データの解析

ようやく解析。ここからが楽しいRの時間ですね。まずはデータの概要を眺める。 # input file format: key name 200601 200602 200603 .... read.sy.data <- function(file){ d <- read.delim(file) n <- colnames(d) # make colnames: X200812 -> Dec 2008 c…

2008年声優言及数 作業メモ(3) 言及数グラフデータを集計

グラフデータの取得が終わったので、取得したデータを解析。 PNGから言及数を解析する この辺。 「2006年声優言及数」の検索結果 - XXXannex結構泥臭い感じで、libpngを使って解析。こういうのはCでやった方が簡単かなー。今年の罠としては、グラフのボーダ…

2008年声優言及数 作業メモ(2) 言及数グラフデータを取得

キーワードグラフサービス - XXXannex この辺りからパラメーターを調べて、名前リストから言及数データをダウンロードするためのスクリプトを生成する。 日付の計算 日付のパラメーターを指定するに当たっては、こんな感じのスクリプトを作成する。 use stri…

2008年声優言及数 作業メモ(1) 声優名一覧を取ってくる

今年もやっておきましょう、と思って作業ディレクトリーを眺めてみたのですが・・・見事に訳が分からない(笑)メモを見ると「readpng2r.plで出力を加工」などと書いてあるが、肝心のreadpng2r.plとやらが見つからないというのは・・・。しかも、入力と出力…

ちょっとだけ公開

8割方生データですが。 $ nkf --url-input -s table.dat | head -11 total a b 戸松遥 2206.34879781421 14.7360027228236 -8.0397432420435 伊藤かな恵 632.340327868855 3.28314462914984 6.48943128435466 高垣彩陽 1177.59683060109 2.83235810443588 42…