便利ソフト紹介/R のバックアップ(No.2)

R †

フリーの統計解析ソフト。普通にこの手のソフトを買うと10万円とかとられるので懐にやさしい。かなり高機能。ソフト名で検索しにくいのが最大の欠点。

↑

ダウンロード †

以下のCRAN(The Comprehensive R Archive Network)ミラーのうち、お好きなところで。

会津大学 ftp://ftp.u-aizu.ac.jp/pub/lang/R/CRAN
岡田氏個人運営 http://cran.okada.jp.org
筑波大学 http://cran.md.tsukuba.ac.jp
東京大学 http://ftp.ecc.u-tokyo.ac.jp/CRAN/

↑

インストール・使い方 †

以下を参照。「R-x.x.x-win32.exe」のような名前のファイル(32bit版Windowsの場合)をダウンロードして実行するだけ。

R-Tips http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html
RjpWiki? http://www.okada.jp.org/RWiki/?RjpWiki

インストールしたら、必要ならR User Configurationで設定を変更しておこう。また、RコマンダーというGUI環境が用意されているので、使いたい場合は

install.packages("Rcmdr")
library(Rcmdr)

のように入力（インストールは初めてのときのみ）するとRコマンダーが起動する。最初の起動には分析に必要なパッケージを沢山ダウンロード＆インストールするので、多少時間がかかる。Rコマンダーについては

〔GUI 版R〕R Commander の説明書　 http://cwoweb2.bai.ne.jp/~jgb11101/files/R-commander.pdf
Rcmdrの機能　http://www.okada.jp.org/RWiki/?Rcmdr%A4%CE%B5%A1%C7%BD

を参照。

↑

オンライン・ドキュメント（PDF） †

R-intro.の日本語訳 http://phi.med.gunma-u.ac.jp/swtips/R-jp-docs/R-intro-170.jp.pdf
統計分析ソフトウェアRの使用法 http://www.otaru-uc.ac.jp/~nisiyama/Documents/rmanual.pdf
Rによる統計解析の基礎（同名の書籍の草稿） http://phi.med.gunma-u.ac.jp/statlib/stat.pdf
Rによる保健医療データ解析演習 http://phi.med.gunma-u.ac.jp/msb/medstatbook.pdf
Rノート:データ解析とグラフィックスのためのプログラミング環境 http://www.geocities.co.jp/HiTeens/5433/R/Rfiles/R-jp.pdf
心理学データ解析のための統計ソフト R のミニミニマニュアル http://www1.gifu-u.ac.jp/~s_oga/Rmanual.pdf
Econometrics in R http://cran.r-project.org/doc/contrib/Farnsworth-EconometricsInR.pdf
R、R言語、R環境・・・・・・ http://www1.doshisha.ac.jp/~mjin/R/
RjpWiki? アーカイブス http://www.okada.jp.org/RWiki/?RjpWiki%20%A5%A2%A1%BC%A5%AB%A5%A4%A5%D6%A5%B9
maselab-R- http://www.is.titech.ac.jp/is-wiki/?maselab%2FR#teefddcd
R for Stata Users http://uqu.edu.sa/files2/tiny_mce/plugins/filemanager/files/4281670/aakpro/algebra/alg1/alg2/alg3/alg4/R%20for%20Stata%20Users.pdf

他にもぐぐるといっぱい出てくる。CRANには他にもマニュアル等が

あたりに置いてある。英語が多いが、日本語・中国語などのもあり。本については

R本リスト http://www.okada.jp.org/RWiki/?R%CB%DC%A5%EA%A5%B9%A5%C8

を参照。

↑

データの操作 †

↑

データの読み込み †

「data.csv」というcsvファイルを「dataframe」という名前で読み込む。

dataframe <- read.csv("data.csv", stringsAsFactors = FALSE)

↑

データの書き出し †

data.csvという名前で保存する場合、以下のようにする。

write.table(dataframe, "data.csv", sep=",", na="", quote = T, col.names = T, row.names = F, append = F)

↑

データの抽出 †

column列が「hoge」となっている行を抽出。

dataframe2 <- subset(dataframe, column == "hoge")

↑

データフレームの指定 †

「with」という関数を使うと、関数中で使うデータフレーム名を1回書くだけで済む。
```
with(dataframe, ・・・)
```
回帰ではdataオプションをつけられる。
```
kaiki.kekka  <- lm(y ~ x,  data = dataframe)
```
attach(dataframe)とdetach(dataframe)の間ではデータフレームが固定される。

↑

多重ループ †

「expand.grid」や「outer」を使うといいらしい。

参照 http://d.hatena.ne.jp/teramonagi/20110330/1301486306

↑

分散分析 †

http://mat.isc.chubu.ac.jp/R/tech.html

↑

Wilcoxson検定(Mann-Whitney検定) †

標準のwilcox.testは近似計算になるらしいので、

install.packages("exactRankTests")
library(exactRankTests)
wilcox.exact(A群,B群)

のようにすると正確な値が出る。
これも古くなったらしく、代わりに

install.packages("coin")
library(coin)
wilcox_test(c(A群,y) ~ factor(c(rep("A群",length(A群)),rep("B群",length(B群)))), distribution="exact")

とするらしい。

参照 http://oku.edu.mie-u.ac.jp/~okumura/stat/wmw.html

↑

計量経済 †

必要なパッケージ類は

CRAN Task View http://www.okada.jp.org/RWiki/index.php?cmd=read&page=CRAN%20Task%20View

からまとめてインストールすれば楽。計量経済学のためには

CRAN Task View: Computational Econometrics http://cran.md.tsukuba.ac.jp/web/views/Econometrics.html

を入れる。入れ方は

install.packages("ctv")
library(ctv)
install.views("Econometrics")

でおけ。

Rでエコノメトリクス http://www.okada.jp.org/RWiki/?R%A4%C7%A5%A8%A5%B3%A5%CE%A5%E1%A5%C8%A5%EA%A5%AF%A5%B9
Rを使って計量経済分析 http://www.sugi-shun.com/econwiki/index.php?R%A4%F2%BB%C8%A4%C3%A4%C6%B7%D7%CE%CC%B7%D0%BA%D1%CA%AC%C0%CF
統計パッケージR http://hnami.or.tv/m2/index.php/%E7%B5%B1%E8%A8%88%E3%83%91%E3%83%83%E3%82%B1%E3%83%BC%E3%82%B8R

↑

Robustな標準誤差 †

以下のように書く。

kaiki <- lm(y ~ x1 + x2 + x3, data = hogedata)
coeftest(kaiki, vcov=vcovHC(kaiki, type = "HC1"))

オプションのデフォルトはHC3。HC1にするとStataと同じ結果を得る(Stata13と比較)。

参照
- http://cran.r-project.org/web/packages/sandwich/sandwich.pdf
- http://web.econ.keio.ac.jp/staff/hk/ecm2/resume/Rintro.pdf

↑

パネルデータ分析 †

plmを使う。モデルはwithin, random, ht, between, pooling, fdを指定できる。ランダム効果モデルではswar(標準), amemiya, walhus, nerlove, kinlaの5つを指定できる。

outcome <- plm(y ~ x1 + x2, data = hoge, model = "random", random.method = "amemiya")

のように書く。

参照

↑

欠損値について †

↑

分析結果の出力 †

↑

ログの保存 †

ファイル - ファイルの保存で保存できる。

↑

わかりやすく書くために †

Google's R Style Guide の翻訳 http://www.okada.jp.org/RWiki/?Google%27s%20R%20Style%20Guide

↑

その他 †

適当なリンク。

Rによるデータ解析 http://homepage2.nifty.com/nandemoarchive/sas_r_excel/mokuji_r.htm
Dataninja http://dataninja.wordpress.com/

実践！ Rで学ぶ統計解析の基礎(@IT)
1. Rは統計解析のブッシュナイフだ http://www.atmarkit.co.jp/fcoding/articles/stat/03/stat01a.html
2. Rで実践する統計的検定の初歩 http://www.atmarkit.co.jp/fcoding/articles/stat/02/stat02a.html
3. Rによるオープン・データの可視化（1） http://www.atmarkit.co.jp/fcoding/articles/stat/03/stat03a.html
4. Rによるオープン・データの可視化（2） http://www.atmarkit.co.jp/fcoding/articles/stat/04/stat04a.html
5. インターリュード: TwitterとR http://www.atmarkit.co.jp/fcoding/articles/stat/05/stat05a.html
6. 夏の異常気象をオープン・データで確認 http://www.atmarkit.co.jp/fcoding/articles/stat/06/stat06a.html
7. 大相撲のアノーマリー（1） http://www.atmarkit.co.jp/fcoding/articles/stat/07/stat07a.html
8. 大相撲のアノーマリー（2） http://www.atmarkit.co.jp/fcoding/articles/stat/08/stat08a.html

実践！WebマーケターのためのR入門
1. とっつきにくいけど実はエクセル以上に賢いヤツフリー統計解析ソフトウェア「R」を触ってみよう http://markezine.jp/article/detail/19808
2. Rで本格的に分析を始める前に「必ず」確認しておきたいこと http://markezine.jp/article/detail/20069
3. 時系列データと箱ひげ図を利用して、ちゃちゃっとデータを分解し変動要因を特定しよう http://markezine.jp/article/detail/20427
4. Rのパワーアップキットを使ってイケてるグラフをサクッと作成しよう http://markezine.jp/article/detail/20541
5. ダミー変数を使って上手にデータをまとめ、グループごとの特徴を把握しよう http://markezine.jp/article/detail/20790

caretパッケージのdummyVarsによるダミー変数の作り方 http://estrellita.hatenablog.com/entry/2014/07/29/091448

生産年齢人口が減るとデフレになる? http://tacmasi.blogspot.com/2010/10/blog-post.html 世界銀行のデータを用いて人口-物価や人口-貨幣量の相関を分析。

裏 RjpWiki? http://blog.goo.ne.jp/r-de-r

マイクロソフトが「Microsoft R Server」を公開 http://www.atmarkit.co.jp/ait/articles/1601/08/news147.html