R

フリーの統計解析ソフト。普通にこの手のソフトを買うと10万円とかとられるので懐にやさしい。かなり高機能。ソフト名で検索しにくいのが最大の欠点。

ダウンロード

以下のCRAN(The Comprehensive R Archive Network)ミラーのうち、お好きなところで。

インストール・使い方

以下を参照。「R-x.x.x-win32.exe」のような名前のファイル(32bit版Windowsの場合)をダウンロードして実行するだけ。

インストールしたら、必要ならR User Configurationで設定を変更しておこう。また、RコマンダーというGUI環境が用意されているので、使いたい場合は

install.packages("Rcmdr")
library(Rcmdr)

のように入力(インストールは初めてのときのみ)するとRコマンダーが起動する。最初の起動には分析に必要なパッケージを沢山ダウンロード&インストールするので、多少時間がかかる。Rコマンダーについては

を参照。

オンライン・ドキュメント(PDF)

他にもぐぐるといっぱい出てくる。CRANには他にもマニュアル等が

あたりに置いてある。英語が多いが、日本語・中国語などのもあり。本については

を参照。

データの操作

データの読み込み

「data.csv」というcsvファイルを「dataframe」という名前で読み込む。

dataframe <- read.csv("data.csv", stringsAsFactors = FALSE)

データの書き出し

data.csvという名前で保存する場合、以下のようにする。

write.table(dataframe, "data.csv", sep=",", na="", quote = T, col.names = T, row.names = F, append = F)

データの抽出

column列が「hoge」となっている行を抽出。

dataframe2 <- subset(dataframe, column == "hoge")

データフレームの指定

参照

プログラミング

演算子

多重ループ

「expand.grid」や「outer」を使うといいらしい。

分散分析

Wilcoxson検定(Mann-Whitney検定)

標準のwilcox.testは近似計算になるらしいので、

install.packages("exactRankTests")
library(exactRankTests)
wilcox.exact(A群,B群)

のようにすると正確な値が出る。
これも古くなったらしく、代わりに

install.packages("coin")
library(coin)
wilcox_test(c(A群,y) ~ factor(c(rep("A群",length(A群)),rep("B群",length(B群)))), distribution="exact")

とするらしい。

計量経済

必要なパッケージ類は

からまとめてインストールすれば楽。計量経済学のためには

を入れる。入れ方は

install.packages("ctv")
library(ctv)
install.views("Econometrics")

でおけ。

Robustな標準誤差

以下のように書く。

kaiki <- lm(y ~ x1 + x2 + x3, data = hogedata)
coeftest(kaiki, vcov=vcovHC(kaiki, type = "HC1"))

オプションのデフォルトはHC3。HC1にするとStataと同じ結果を得る(Stata13と比較)。

パネルデータ分析

plmを使う。モデルはwithin, random, ht, between, pooling, fdを指定できる。ランダム効果モデルではswar(標準), amemiya, walhus, nerlove, kinlaの5つを指定できる。

outcome <- plm(y ~ x1 + x2, data = hoge, model = "random", random.method = "amemiya")

のように書く。

欠損値について

分析結果の出力

ログの保存

ファイル - ファイルの保存 で保存できる。

わかりやすく書くために

その他

適当なリンク。


トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS

e[NECir Yahoo yV LINEf[^[z500~`I
z[y[W NWbgJ[h COiq@COsI COze