2ch総レス数 VS mixiコミュニティ参加者数

この話。

まずはこの辺のデータをごにょごにょして2ch総レス数とmixiコミュニティ参加者数を取得します。

name	2ch	mixi
豊崎愛生	50610	9941
岸尾だいすけ	22883	6616
藤原啓治	8382	6655
関俊彦	26351	5790
戸松遥	33006	6284
石田彰	67754	6486
櫻井孝宏	41762	12355
堀江由衣	376306	14678
平野綾	193595	28015
杉田智和	48235	23465
茅原実里	204013	18308
置鮎龍太郎	19251	6398
伊藤静	57673	6824
能登麻美子	116401	11771
鈴木達央	5705	7235
喜多村英梨	39231	4590
林原めぐみ	82233	11861
小林ゆう	35041	6422
小清水亜美	60262	5209
新谷良子	64174	5779
小野大輔	26094	20190
吉野裕行	14312	5395
沢城みゆき	53044	8616
鳥海浩輔	10786	7136
坂本真綾	146353	30470
田村ゆかり	578558	18493
田中理恵	101283	6024
後藤邑子	82625	7435
井上和彦	4894	6711
水樹奈々	587417	43003
神谷浩史	41037	21720
花澤香菜	33779	4840
大塚明夫	2821	19160
宮野真守	25562	11965
若本規夫	19035	25373
緑川光	30483	11381
子安武人	31966	11448
野中藍	64470	4877
福山潤	24290	14360
井上麻里奈	51592	7939
阿澄佳奈	87590	5041

で、ggplot2で散布図を描きます。

library(ggplot2)
d <- read.delim("merge.out")
p <- ggplot(d, aes(x=mixi, y=X2ch, label=name)) + geom_point(color="red") + geom_text(size=3.5)
p <- p + scale_x_log10("mixiコミュニティ参加者") + scale_y_log10("2ch総レス数")

この2行を書くに1時間もかかるとか・・・!公式のリファレンスに全部書いてはあるのだけどね。
で、こんな感じ。twitpicに貼ったのは scale_*_log でスケーリングしたので自然対数になって数値が今ひとつ分かりにくかったので、log10にしました。

やっぱggplot2は難しいけどキレイ・・・!