この話。
name 2ch mixi 豊崎愛生 50610 9941 岸尾だいすけ 22883 6616 藤原啓治 8382 6655 関俊彦 26351 5790 戸松遥 33006 6284 石田彰 67754 6486 櫻井孝宏 41762 12355 堀江由衣 376306 14678 平野綾 193595 28015 杉田智和 48235 23465 茅原実里 204013 18308 置鮎龍太郎 19251 6398 伊藤静 57673 6824 能登麻美子 116401 11771 鈴木達央 5705 7235 喜多村英梨 39231 4590 林原めぐみ 82233 11861 小林ゆう 35041 6422 小清水亜美 60262 5209 新谷良子 64174 5779 小野大輔 26094 20190 吉野裕行 14312 5395 沢城みゆき 53044 8616 鳥海浩輔 10786 7136 坂本真綾 146353 30470 田村ゆかり 578558 18493 田中理恵 101283 6024 後藤邑子 82625 7435 井上和彦 4894 6711 水樹奈々 587417 43003 神谷浩史 41037 21720 花澤香菜 33779 4840 大塚明夫 2821 19160 宮野真守 25562 11965 若本規夫 19035 25373 緑川光 30483 11381 子安武人 31966 11448 野中藍 64470 4877 福山潤 24290 14360 井上麻里奈 51592 7939 阿澄佳奈 87590 5041
で、ggplot2で散布図を描きます。
library(ggplot2) d <- read.delim("merge.out") p <- ggplot(d, aes(x=mixi, y=X2ch, label=name)) + geom_point(color="red") + geom_text(size=3.5) p <- p + scale_x_log10("mixiコミュニティ参加者") + scale_y_log10("2ch総レス数")
この2行を書くに1時間もかかるとか・・・!公式のリファレンスに全部書いてはあるのだけどね。
で、こんな感じ。twitpicに貼ったのは scale_*_log でスケーリングしたので自然対数になって数値が今ひとつ分かりにくかったので、log10にしました。
やっぱggplot2は難しいけどキレイ・・・!