R

stringrパッケージ

R

Manipulation de chaînes de caractères avec stringr - Alea 「Rを使ってYahoo!乗換案内から運賃や所要時間,乗換回数を取得するコード書いた」をscrapeRで書いてみたよ - XXXannex > library(stringr) > str_replace("あやにゃんペロペロ", "ペロペロ", "…

apply系関数でデータフレームを返したいときは plyr パッケージが便利

R

この話の続き。 「Rを使ってYahoo!乗換案内から運賃や所要時間,乗換回数を取得するコード書いた」をscrapeRで書いてみたよ - XXXannex 前のエントリーに追記してもよかったのですが、内容的に独立したエントリーに分けた方がよさそう。 listから変換 apply…

「Rを使ってYahoo!乗換案内から運賃や所要時間,乗換回数を取得するコード書いた」をscrapeRで書いてみたよ

R

こちらの話。 Rを使ってYahoo!乗換案内から運賃や所要時間,乗換回数を取得するコード書いた - Fire and Motion Rubyでもなく、Perlでもなく、Rでスクレイピングしようというコンセプトがすばらしいです。熱い。 あちらのサイトではスクレイピング部分が結構…

2ch総レス数 VS mixiコミュニティ参加者数

R

この話。 window.twttr = (function(d, s, id) { var js, fjs = d.getElementsByTagName(s)[0], t = window.twttr || {}; if (d.getElementById(id)) return t; js = d.createElement(s); js.id = id; js.src = "https://platform.twitter.com/widgets.js"; …

S4を勉強する(1)

R

とりあえずブックマークからS4関連の記事をピックアップ。まずはこれを読むところからですな。 S4が分からないので、本を買ってきた - yasuhisa's blog データ解析言語Rによる統計的プログラミング: 第 3 回 再利用可能なオブジェクト指向プログラミング How…

2009年声優言及数 作業メモ(7) データの解析 つづき

R

解析が終わったので、グラフを書くことに。せっかくなので、今年は噂のggplot2を使ってみようかと。こちらのサイトなどを参考にしつつ、公式のリファレンスに載ってるサンプルを片っ端から試していけば何となく使い方は理解できました。 http://had.co.nz/gg…

めも

R

src/cairogd.c 393 SEXP cairo_font_set(SEXP args){ 394 #if CAIRO_HAS_FT_FONT 395 SEXP v; 396 int i; 397 const char *font; 398 399 args = CDR(args); 400 401 /* regular font */ 402 for (i = 0; i < 5; i++){ 403 v = CAR(args); args = CDR(args);…

twitteR

R

http://ja.doukaku.org/278/ http://blog.revolution-computing.com/2009/06/tweeting-from-r.html CRAN - Package twitteR > ns <- updateStatus('test message', sess) 以下にエラー rawToChar(out) : 引数 'x' は raw ベクトルでなくてはなりません > upd…

しりとりってグラフ構造だよね

R

http://ja.doukaku.org/277/ igraphにぶち込んで、最長のパスを求めるようなことができれば分かるはずなんだけど・・・試す時間がない。溜まってるアニメの感想書いて、感想調査が終わればチャレンジしてみたい。http://ja.doukaku.org/276/ こっちもsimecol…

来シーズンのアニメの本数をヒストグラムにしたい

R

http://www.moonphase.cc/Html/anime.html からデータを取ってきて、Excelに貼り付けます。そのあと、日付の列だけコピーしてRで加工する。本当はWeb scrapingをRでやりたいんだけど、めんどくさいから入力データは事前に作っておく。確かRのドキュメントで…

Rでトラックバック

R

エロと風俗情報満載 どう抜く?用のエントリー。RでHTTPリクエストを扱うには、Pure Rで実装されたhttpRequestとlibcurlを使ったRCurlがあるようで。 CRAN - Package httpRequest CRAN - Package RCurl httpRequest、pure Rというのがすごいな。ソースを見る…

POSIXctとPOSIXltの違い

R

知ってる人は知ってるけど、マニュアルにも明言されていないPOSIXctとPOSIXltの違い。 "POSIXct" is more convenient for including in data frames, and "POSIXlt" is closer to human-readable forms. ・・・って言われてもなあ。 結論から言うと、POSIXct…

Rにおける「.」について 補足の補足

R

なんと、Rにもユーザーコミュニティが発足したらしいです。 Tsukuba.R#1をやってきたよ!! - yasuhisa's blog "R"の歴史から、LispとしてのRの解説まで幅広い構成。すごいです。Emacs Lispもまともに読み書きできない自分としては、R使うならSchemeとかのLisp…

ゆのっちゆのっちー "_"が使えないよー

R

こんなのはダメだろうなあ・・・。 yunocchi <- function(){ f <- FALSE function(s){ paste(sapply(unlist(strsplit(gsub("\n", "", s), " ")), function(i) (switch(i, "X" = {ifelse((f <<- !f), "ひだまり", "")}, "/" = {ifelse((f <<- !f), "", "スケ…

Rで_をシンボルとして使いたい

R

Rで"_"をシンボルとして使うにはどうすればいいのだ・・・ > _ Error: unexpected input in "_" うーん。こうすればできるのは分かってるんだけど、そのまま使いたいのだよね・・・ > assign("_", 123) > get("_") [1] 123

ゆの in R

R

inspired by: ゆの in Ruby - 冬通りに消え行く制服ガールは✖夢物語にリアルを求めない。 - subtech ゆの in Perl - Bulknews::Subtech - subtech とりあえず書いてみた。 "_"をシンボルとして使うと文法エラーになる・・・ので、仕方なく"v"にしました 自分…

Rでsay

R

どう書く?orgを眺めてて気づいたのですが。pooqさんの投稿(http://ja.doukaku.org/comment/6198/ とか)で、writeLinesを標準出力に使ってるのがちょっと新鮮だった。なるほど、cat(string, sep="\n")とかしなくていいのか。確かにそうだよな・・・。 say …

Rで基数変換のメモ

R

基数変換には色々やり方があると思いますが、そのうちの一つとして。 > a <- 10 > str(a) num 10 > class(a) [1] "numeric" > class(a) <- "hexmode" > a [1] "a" > str(a) Class 'hexmode' num 10 > class(a) <- "octmode" > a [1] "12" > str(a) Class 'oc…

Rでヒアドキュメント的な何かを実現する、たったふたつの冴えたやりかた

R

Rでヒアドキュメント的何か - yasuhisa's blog 出来心でコメントしてしまったのだけど、ダイアリーの方でも少し反応してみる。そんな面倒なことしなくても、Rはちゃんと直感的なインターフェイスを用意してくれているよ!というお話。 マニュアルによると、r…

Rのifelse

R

http://ja.doukaku.org/comment/4279/ に書いたのだけど自画自賛してみる。 Rのifelseはリストも取れるのでこんなことができる。 > ifelse(1:26%%2, letters, LETTERS) [1] "a" "B" "c" "D" "e" "F" "g" "H" "i" "J" "k" "L" "m" "N" "o" "P" "q" "R" "s" "T…

2007年6月〜8月、はてなの言及数がおかしくなってる件について その2

R

データがちゃんと取れたら(12月末のデータが取れたら)表で公開しよう。 とりあえず、月をそろえて、あとキーワード数自体も年毎に違ってそうなので、平均値をプロットすることにしました。 5月もちょっと微妙だけど、6,7,8月が明らかにおかしい。

2007年6月〜8月、はてなの言及数がおかしくなってる件について その3

R

各月の平均値に関して、2006年のデータとt検定を行いました。正常なデータでも0.05を切っているものが多かったのはサンプル数が多いからなんだろうけど、それでも6月〜8月は異常。まさに桁が違う。 ちょっとヘンだと思ってた5月は、2005年の1〜2月とそれほど…

2007年6月〜8月、はてなの言及数がおかしくなってる件について

R

手元に2005年、2006年の集計データがあったので、それぞれについて月ごとの総和を比較してみました。 plot.all <- function(df1, df2, df3, ...){ palette <- c("#1E5692", "#3E9A3B", "#F9A015", "#DA2025", "#7E377E") plot(apply(df1, 2, sum), col=palet…

RでURIアンエスケープ

R

ちょっと必要になったので。 http://cran.r-project.org/src/contrib/Descriptions/CGIwithR.html のhexDecode()関数を参考に作りました。 hexDecode <- function(string){ string <- gsub("\\+", " ", string) string <- gsub("%09", "\t", string) string …

What is R?

R

Many users think of R as a statistics system. We prefer to think of it of an environment within which statistical techniques are implemented. R: What is R? 多くのユーザーはRを統計システムだと思っていますが、我々はRを統計解析を含めた「環境…

Rでグラフ理論

R

igraphというライブラリーがあるそうです。 Igraph available.packages() install.packages("igraph") require("igraph") 色々使ってみよう。 追記 たまに検索エンジンから来る方がいるようなので。 実装例 → エロと風俗情報満載 どう抜く?

ユークリッドの互除法

R

なんとなく。 gcd <- function(m, n){ l <- sort(c(m, n)) if(l[1] == 0) return(l[1]) while((ll <- l[2]%%l[1]) != 0){ l <- c(ll, l[1]) } return(l[1]) } gcd(2147483647, 10) [1] 1

循環小数 その2

R

さて。2^31-1は素数らしいので、当然10とも互いに素でしょう。とすると、10^e≡1 (mod 2147483647)となる最小のeが循環節の長さになるわけですが・・・。 for(i in 1:100){ print(paste(i, ":", (10**i)%%2147483647), sep="") } [1] "1 : 10" [1] "2 : 100" …

メタなR関数色々

R

Rはよく分からないデータ型やよく分からない関数がたくさんある。複雑。今思いつく範囲でまとめておく。 付加要素系 attributes class comment names 概要系 str summary args dput

Message-ID

R

これもまた複雑なようで・・・。ぐぐって最初にあったこちらのサイトを参考に作成。 Message-ID # timestamp and random number (without hashing) getMessageID <- function(address){ lp <- paste(format(Sys.time(), "%Y%m%d%H%M%S"), runif(1), sep="") …