2007-07-01から1ヶ月間の記事一覧

トランプの・・・

Aさん「(この情報だけでは)分かりません」 Bさん「私も分かりません.ただ,Aさんが『分かりません』というのは分かっていました」 それを聞いたAさん「それなら,分かりました」 それを聞いたBさん「それなら,私も分かりました」 http://ja.doukaku.org/34…

What is R?

R

Many users think of R as a statistics system. We prefer to think of it of an environment within which statistical techniques are implemented. R: What is R? 多くのユーザーはRを統計システムだと思っていますが、我々はRを統計解析を含めた「環境…

入出力の中継・・・

Rにはそういう機能がないので、どうしよう・・・。最悪拡張で作るしかないけど、なるべくPure RまたはCRANライブラリーでやりたいしなあ。 > f <- fifo("fifo", "w+") > p1 <- pipe("./output") > p2 <- pipe("./input < fifo") > > sink(f) > cat(readLines…

Rでグラフ理論

R

igraphというライブラリーがあるそうです。 Igraph available.packages() install.packages("igraph") require("igraph") 色々使ってみよう。 追記 たまに検索エンジンから来る方がいるようなので。 実装例 → エロと風俗情報満載 どう抜く?

ユークリッドの互除法

R

なんとなく。 gcd <- function(m, n){ l <- sort(c(m, n)) if(l[1] == 0) return(l[1]) while((ll <- l[2]%%l[1]) != 0){ l <- c(ll, l[1]) } return(l[1]) } gcd(2147483647, 10) [1] 1

循環小数 その2

R

さて。2^31-1は素数らしいので、当然10とも互いに素でしょう。とすると、10^e≡1 (mod 2147483647)となる最小のeが循環節の長さになるわけですが・・・。 for(i in 1:100){ print(paste(i, ":", (10**i)%%2147483647), sep="") } [1] "1 : 10" [1] "2 : 100" …

メタなR関数色々

R

Rはよく分からないデータ型やよく分からない関数がたくさんある。複雑。今思いつく範囲でまとめておく。 付加要素系 attributes class comment names 概要系 str summary args dput

循環小数

そろそろ手をつけたい。 HugeDomains.com - Shop for over 300,000 Premium Domains 力技で考えてもいいんだけど、せっかくやるからには色々調べてから解きたい。こういう数学って苦手だけど楽しいなあ。結局のところ俺はお勉強が好きなのでしょうね。 は既…

Message-ID

R

これもまた複雑なようで・・・。ぐぐって最初にあったこちらのサイトを参考に作成。 Message-ID # timestamp and random number (without hashing) getMessageID <- function(address){ lp <- paste(format(Sys.time(), "%Y%m%d%H%M%S"), runif(1), sep="") …

うーんなんでだろ

R

ようやくbase64エンコーディングができました。 base64.table <- c(LETTERS, letters, unlist(strsplit("0123456789+/", ""))) tobase64 <- function(str){ r <- charToRaw(str) paddings <- (3-length(r))%%3 r1 <- c(r, as.raw(rep(0, paddings))) m <- ma…

Base64 for R

R

Base64 - Wikipedia http://www.python.jp/doc/2.4/lib/module-base64.html 8bit*3ずつ読んで、6bit*4ずつ書くというアルゴリズムらしい。Rにも文字列 バイナリーの関数はあるのだけど、ビットの内部表現がリトルエンディアン(?)なので非常にみにくい。 >…

ってゆーかってゆーかってゆーか

R

Rはこういうことをするための言語じゃないような・・・と思いつつ、いい練習なので色々考えてるんですが。やはりRの標準機能で双方向パイプは無理っぽいのです。片方向はできるのよ。 > ls <- pipe("ls /") > ls description class mode text opened can rea…

速報なのですよ

にぱー > df[sort.list(df$total, dec=TRUE),c("abb","total")] abb total 15 さよなら絶望先生 484 17 もえたん 427 7 School Days 396 5 ドージンワーク 349 6 ケンコー全裸系水泳部ウミショー 254 4 ななついろ★ドロップス 249 13 ぽてまよ 249 11 ひぐら…

うーん

R

m <- 4 m <- matrix(c(1,0), n, n-1, byrow=!as.logical(n%%2)) 反則かも。。。要は互い違いに棒を入れれば必ず逆順になるわけで。。。 って今見たら気づいている人いっぱいいたよ!うは。

Rのsub/gsubは先行評価らしい

R

・・・のかどうか分からないけど。Rのsub系は\1で*1マッチした文字列を展開してくれるのですが、これを関数の引数にしたりすることはできないらしい。あくまで文字列の一部にしか使えないと。うぐぅ。 例えば gsub("(\\d+)", "\\1abcde", txt, perl=TRUE) み…

わわ

エロと風俗情報満載 どう抜く?の言語にRが増えてる!やった。もしかして手作業だったりするのかな・・・? なんにしてもありがとうございました。coverage拡充のためがんばりたいが、Rの仕様上無理なお題もあるので厳しいww 追記 追加されてることに気づ…

いやあ

やっとできた、ピラミッド表示。 n <- 4 unlist(mapply(function(a, b){cat(rep(" ", a), rep("*", b), "\n", sep="")}, (n-1):0, (1:n)*2-1)) * *** ***** ******* Rなら絶対ループなんて使わなくてもできる!って思ってて、実際できたけど、苦肉の策ではあ…

(21) ある値 x が増加数列 v のどこの間にあるかを計算する関数、findInterval() -- 2005.01.09 そんなのあったんか・・・。さすがR、何でもあるわ・・・。

はわわわわ / キーワード言及数の統計について・・・その6

R

なんか間違えてたっぽい・・・。瀬戸の花嫁は微妙な感じかも。一応スクリプト完成版。 # df: title, before.score, after.score calc.all <- function(df){ # create rank colnames(df) = c("title", "b", "a") df <- df[sort.list(df$b, dec=TRUE),] df <- …

キーワード言及数の統計について・・・その3

> p <- df$p_3m/df$p_begin > l <- sort.list(p, dec=TRUE) > df3 <- data.frame(df[l, c(2,5,6)], p=p[l]) > df3[(df3$p_3m > 0.5) | (df3$p_begin > 0.5),] abb p_3m p_begin p 12 クレイモア 0.7745922 0.7243621 1.0693439 11 瀬戸の花嫁 0.7888443 0.75…

キーワード言及数の統計について・・・その4

下のデータフレームはどうやって作ったの?という話。色々ゴチャゴチャやったけど、.Rhisotry見ると実際の作業はそれほど難しいものではなかったらしい。色々ゴチャゴチャ確認しながらできるのはRの大きな魅力なので、それはそれで問題なし。むしろ作業履歴…

キーワード言及数の統計について・・・その5

今度は言及数の比&順位の比。ロミジュリとsolaですねー。solaが再評価されるとうれしい。瀬戸の花嫁はやっぱり低いでしょ?つまらないはずないんだから、どこかにその形跡が出るはずなのよ。 > df2[(df2$total_begin > 100 | df2$total_3m > 100),] total_b…

Rubyのrand()はMersenne Twister!?

rubyのrandom.cを見ててびっくりした。すごい。Rとの比較をしようと思ったのに・・・。RはもちろんMTですよ。 > RNGkind() [1] "Mersenne-Twister" "Inversion"

さらに簡単なデータ読み込み

R

http://sheet.zoho.com/public.do?docurl=a%2Fga3qvYNJ7%2BuVm31GQvyw%3D%3D&name=joIhttsX89xdWlUs9ES03w%3D%3D で、クリップボードにデータをコピーする。例えば列AからJまで選択してクリップボードへ。その後Rで読む時、ファイル名に"clipboard"を指定す…

Rでデータフレームをソートする方法

R

sort.listという関数があります。ほんとRは何でもあるな! > df2 <- df[sort.list(df$total_begin, decreasing=TRUE),] > df[c(1,2,3),] abb total_begin total_3m 1 らき☆すた 1304 915 2 グレンラガン 585 362 3 アイドルマスター 426 305 > df2[c(1,2,3),…

キーワード言及数の統計について・・・続き

R

で。正規分布がダメなので別な手法で行くことにする。簡単に思い浮かぶのは、正規分布じゃなくてデータ自身から累積分布関数を作ろうっていうノンパラメトリックな手法。分布関数はさっき作った密度関数から作ることにする。せっかくあるんだから使わねば。 …

キーワード言及数の統計について・・・

R

まず2007年2q開始アニメについて、前の調査で拾い切れなかったアニメ(電脳コイルとかね)を全て網羅した結果と、3ヵ月後(6月最終週だ)に同じ集計をした結果について調査しました。↓で公開。 http://sheet.zoho.com/public.do?docurl=a%2Fga3qvYNJ7%2BuVm3…

統計学的検定とは不完全な背理法なんだよなあ

改めて思う。 「間違ってるとは言いきれない」と検定したい仮説の反対(帰無仮説)を否定するというのは何とも回りくどい・・・。 で、TypeI error(偽陽性)とTypeII error(偽陰性)、あとpower(検出力)の絡みもあって、TypeI errorを気にしすぎるとpowerが下…

タグ

タグはどうしてタイトルの前につくんだろう。せめてHTMLとして独立してくれればCSSでどうこうできるのに、今のままではどうしようもないのがなんとも。tdiaryとの互換性を保つため、とかいう話?ですが・・・うーん。

はてなのIDに使用可能な文字は?

キーワード「はてなID」によると 大文字あるいは小文字のアルファベット・0-9の数字・「-」・「_」(いずれも半角)のいずれかを3-15文字並べたもの(ただし最初の文字はアルファベットであること)から成る。アルファベットの大文字と小文字は互いに区別される…