R
の編集
http://asuzuki.r.ribbon.to/pukiwiki/index.php?R
[
トップ
] [
編集
|
差分
|
バックアップ
|
添付
|
リロード
] [
新規
|
一覧
|
単語検索
|
最終更新
|
ヘルプ
]
-- 雛形とするページ --
??ª®??¢±???¤??ªÂ/iHP-120
BlackBerry
BonTsDemux
BracketName
Express5800/S70SD
Fedora Core 4 インストールメモ
FormatRule
FormattingRules
FrontPage
Get Started with Discreet Hookup Platforms In The Usa
Get Started with Local Encounters Websites To For Just Sex
Guide To Free Local Hookup App Usa
Guide To Free Meetup Site No Cost
HandBrake
Help
InterWiki
InterWikiName
InterWikiSandBox
InterWikiテクニカル
JkDefrag
MenuBar
MultiWriter
My Work
OpenOffice
PC
PC/SC420
PHP
PageDefrag
PageNavigator
PostScript
Profile
PukiWiki
PukiWiki/1.4
PukiWiki/1.4/Manual
PukiWiki/1.4/Manual/Plugin
PukiWiki/1.4/Manual/Plugin/A-D
PukiWiki/1.4/Manual/Plugin/E-G
PukiWiki/1.4/Manual/Plugin/H-K
PukiWiki/1.4/Manual/Plugin/L-N
PukiWiki/1.4/Manual/Plugin/O-R
PukiWiki/1.4/Manual/Plugin/S-U
PukiWiki/1.4/Manual/Plugin/V-Z
QtPalmtop
R
RecentDeleted
RightBar
SandBox
SiteNavigator
StarSuite
Stata
Stata/パネル
Tips
Tips For Casual Dating Sites
Tips For Local Dating Sites To For Just Sex
Try Out Free Dating Website For Quick Sex
Try Out Top Local Encounters Apps In The Usa
VirtualBox
WikiEngines
WikiName
WikiWikiWeb
WinでLinux
YukiWiki
「反」スタートアップセミナー
『演習ゲーム理論』を勝手に訂正
オンラインで読めるテキスト
ゲーム理論入門
ゲーム理論入門/そもそも、ゲーム理論って何よ?
ゲーム理論入門/ゲーム理論を学びたい人へ
ゲーム理論入門/シャープレイ値
ゲーム理論入門/繰り返しゲーム
ゲーム理論入門/仁
ゲーム理論入門/戦略形ゲーム
ゲーム理論入門/特性関数形ゲーム
ゲーム理論入門/不完備情報
ゼミ生向け
ゼミ生向け/Rによるやさしい統計学
ゼミ生向け/「社会の決まり」はどのように決まるか
ゼミ生向け/産業組織の経済学
ゼミ生向け/産業組織の経済学/第10章
ゼミ生向け/産業組織の経済学/第12章
ゼミ生向け/産業組織の経済学/第1章
ゼミ生向け/産業組織の経済学/第2章
ゼミ生向け/産業組織の経済学/第3章
ゼミ生向け/産業組織の経済学/第4章
ゼミ生向け/産業組織の経済学/第5章
ゼミ生向け/産業組織の経済学/第6章
ゼミ生向け/産業組織の経済学/第7章
ゼミ生向け/産業組織の経済学/第8章
ゼミ生向け/産業組織論
ゼミ生向け/産業組織論/第1章
ゼミ生向け/産業組織論/第2章
ゼミ生向け/産業組織論/第3章
ゼミ生向け/産業組織論/第4章
ゼミ生向け/産業組織論/第5章
ゼミ生向け/産業組織論/第6章
ゼミ生向け/産業組織論/第8章
ゼミ生向け/社会心理学
ゼミ生向け/組織の経済学
ゼミ生向け/法と経済学―企業関連法のミクロ経済学的考察
デジモノ
デジモノ/BlackBerry 8707h
デジモノ/Bluetoothマウス比較
デジモノ/CG-HDLA
デジモノ/DMC-LZ2
デジモノ/DVM-RXH16FB
デジモノ/HT-01A
デジモノ/KSC75
デジモノ/Kindle3
デジモノ/Kuro-Box
デジモノ/LIFEBOOK U
デジモノ/M3
デジモノ/M42 SQUARE
デジモノ/MP860
デジモノ/P3600
デジモノ/PD-205
デジモノ/PR-L5750C
デジモノ/PT2
デジモノ/PX-760A
デジモノ/PX-W3U3
デジモノ/PocketPostPet
デジモノ/QFC-F20
デジモノ/RD-X5
デジモノ/SC420
デジモノ/SL-C3200
デジモノ/VX747?
デジモノ/X51v
デジモノ/gigabeat V30T
デジモノ/iHP-120
デジモノ/wizpy
デジモノ/使ったイヤホン
ノー○○ジア大学特設ページ
プロフィール
ヘルプ
リンク
外書講読
外書講読/1章
外書講読/1章/語句説明
外書講読/8章
外書講読/8章/語句説明
簡単な書き方
気になった話
気になった話/2006年版
気になった話/2007年版
気になった話/2008年版
気になった話/2009年版
気になった話/2010年版
気になった話/2011年版
気になった話/2012年版
気になった話/2013年版
気になった話/2014年版
気になった話/2015年版
気になった話/2016年版
気になった話/2017年版
気になった話/2019年版
気になった話/2021年版
経済学入門
経済学入門/外部性
経済学入門/経済学とは
経済学入門/経済学の基本中の基本
経済学入門/公共財
経済学入門/参考資料
経済学入門/私が選ん「でない」お勧め本リスト
経済学入門/時事ネタ
経済学入門/時事ネタ/伊藤110424
経済学入門/時事ネタ/水谷110831
経済学入門/時事ネタ/藤井091011
経済学入門/時事ネタ/藤井091019
経済学入門/時事ネタ/日銀100615
経済学入門/時事ネタ/冨山141007
経済学入門/時事ネタ/北野111227
経済学入門/時事ネタ/野口091114
経済学入門/時事ネタ/野菜廃棄050824
経済学入門/時事ネタ/國枝110524
経済学入門/需要と供給
経済学入門/需要と供給その2
経済学入門/消費者行動と需要曲線
経済学入門/消費者余剰
経済学入門/生産者行動と供給曲線
経済学入門/生産者余剰と社会的余剰
経済学入門/費用と便益
研究業績一覧
見た本
見た本/アニマルスピリット
見た本/クルーグマンの視座
見た本/ソウルフルな経済学
見た本/テロの経済学
見た本/バカヤロー経済学
見た本/景気と経済政策
見た本/都心回帰の経済学
見た本/読んでいない本について堂々と語る方法
見た本/偏差値40から良い会社に入る方法
見た本/予想どおりに不合理
工学部(B)向け
災害研究まとめ
災害用リンク
参考資料
参考資料/その他
参考資料/ゲーム理論
参考資料/マクロ経済学
参考資料/経済学入門
参考資料/行動経済学
参考資料/産業組織論
産業組織論
産業組織論【学院】
産業連関分析について
質問用ページ
出張講義(経済学)
情報処理
食べ物
整形ルール
専門基礎演習
総合講座III
地方財政
地方財政モデル
注意事項
注目のブツ
豆知識
復興増税賛同者リスト保存版
便利ソフト紹介
便利ソフト紹介/2007 Microsoft Office プログラム用 Microsoft PDF/XPS 保存アドイン
便利ソフト紹介/AVG
便利ソフト紹介/Alcohol 52%
便利ソフト紹介/CDex
便利ソフト紹介/Chromium系ブラウザ
便利ソフト紹介/DVD2WMV
便利ソフト紹介/Daemon Tools
便利ソフト紹介/EBWin
便利ソフト紹介/EPWING辞書
便利ソフト紹介/Exact Audio Copy
便利ソフト紹介/GAUSS Light
便利ソフト紹介/HandBrake
便利ソフト紹介/JCount
便利ソフト紹介/JkDefrag
便利ソフト紹介/KompoZer
便利ソフト紹介/Libre Office
便利ソフト紹介/MPC
便利ソフト紹介/Maxima
便利ソフト紹介/Microsoft Office 互換機能パック
便利ソフト紹介/MuPAD
便利ソフト紹介/NHC
便利ソフト紹介/NextTrain
便利ソフト紹介/Office 2007 オールドスタイル メニューアドイン
便利ソフト紹介/Office2007用の2003風メニュー
便利ソフト紹介/OpenOffice.org
便利ソフト紹介/Opera
便利ソフト紹介/POPFile
便利ソフト紹介/PageDefrag
便利ソフト紹介/PrimoPDF
便利ソフト紹介/R
便利ソフト紹介/Skype
便利ソフト紹介/Softi FreeOCR
便利ソフト紹介/Spam Mail Killer
便利ソフト紹介/StarSuite
便利ソフト紹介/Sygate Personal Firewall
便利ソフト紹介/TeX
便利ソフト紹介/TeX/EPS
便利ソフト紹介/TeX/GSView
便利ソフト紹介/TeX/Ghostscript
便利ソフト紹介/TeX/TeXで表
便利ソフト紹介/TeX/dviout
便利ソフト紹介/UMSSort
便利ソフト紹介/VLC media player
便利ソフト紹介/VMWare
便利ソフト紹介/VirtualBox
便利ソフト紹介/Weka
便利ソフト紹介/Word 2007 アドイン Microsoft Math
便利ソフト紹介/gnuplot
便利ソフト紹介/unDonut+mod
便利ソフト紹介/サクラエディタ
*R [#v371104c] フリーの統計解析ソフト。普通にこの手のソフトを買うと10万円とかとられるので懐にやさしい([[stata価格>https://www.lightstone.co.jp/stata/pricelist.html]], [[EViews価格>https://www.lightstone.co.jp/eviews/prices_aca.html]])。かなり高機能。 **ダウンロード [#wa12af2f] 以下の[[CRAN>http://cran.r-project.org/]](The Comprehensive R Archive Network)ミラーのうち、お好きなところで(提供をやめてしまったところが多い)。 -山形大学 https://ftp.yz.yamagata-u.ac.jp/pub/cran/ -RStudio https://cran.rstudio.com **インストール・使い方 [#k26f922c] 以下を参照。「R-x.x.x-win.exe」のような名前のファイル(Windowsの場合)をダウンロードして実行するだけ。 -R-Tips http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html -RjpWiki http://www.okada.jp.org/RWiki/?RjpWiki まず、デスクトップ用のアイコンを右クリック-プロパティで起動オプションを設定しておこう。「リンク先」の最後に「 --no-save」を追加すると、最後の保存確認が省略される。「作業フォルダー」はデータやスクリプトを置く場所になるので、適当に設定しておこう。 次に、メニューの 編集-GUIプリファレンス からFONTをMS Gothicに変更してSave...を押すと、Rconsoleというファイルが保存される。これをテキストエディターで編集して MDIsize = 800*600+100+50 のような行を追加する。これで起動時のウィンドウサイズ・位置を調整できる(「800*600」がサイズ、「+100+50」がウィンドウの左上の位置)。 追加パッケージのダウンロード先(CRANミラー)の設定はC:\Program Files\R\R-x.x.x\etc(例)にある「Rprofile.site」に local({r <- getOption("repos") r["CRAN"] <- "https://cran.ism.ac.jp/" options(repos=r)}) と追記しておく(統計数理研究所にアクセスする場合)。 -参考 http://www.agr.nagoya-u.ac.jp/~seitai/document/R2009/Rsettings.pdf また、RコマンダーというGUI環境が用意されているので、使いたい場合は install.packages("Rcmdr") library(Rcmdr) のように入力(インストールは初めてのときのみ)するとRコマンダーが起動する。最初の起動には分析に必要なパッケージを沢山ダウンロード&インストールするので、多少時間がかかる。Rコマンダーについては -〔GUI 版R〕R Commander の説明書 http://cwoweb2.bai.ne.jp/~jgb11101/files/R-commander.pdf -Rcmdrの機能 http://www.okada.jp.org/RWiki/?Rcmdr%A4%CE%B5%A1%C7%BD を参照。 **オンライン・ドキュメント(PDF) [#cd7e9049] -R-intro.の日本語訳 http://phi.med.gunma-u.ac.jp/swtips/R-jp-docs/R-intro-170.jp.pdf -統計分析ソフトウェアRの使用法 http://www.otaru-uc.ac.jp/~nisiyama/Documents/rmanual.pdf -Rによる統計解析の基礎(同名の書籍の草稿) http://phi.med.gunma-u.ac.jp/statlib/stat.pdf -Rによる保健医療データ解析演習 http://phi.med.gunma-u.ac.jp/msb/medstatbook.pdf -Rノート:データ解析とグラフィックスのためのプログラミング環境 http://www.geocities.co.jp/HiTeens/5433/R/Rfiles/R-jp.pdf -心理学データ解析のための統計ソフト R のミニミニマニュアル http://www1.gifu-u.ac.jp/~s_oga/Rmanual.pdf -Econometrics in R http://cran.r-project.org/doc/contrib/Farnsworth-EconometricsInR.pdf -R、R言語、R環境・・・・・・ http://www1.doshisha.ac.jp/~mjin/R/ -RjpWiki アーカイブス http://www.okada.jp.org/RWiki/?RjpWiki%20%A5%A2%A1%BC%A5%AB%A5%A4%A5%D6%A5%B9 -maselab-R- http://www.is.titech.ac.jp/is-wiki/?maselab%2FR#teefddcd -R for Stata Users http://uqu.edu.sa/files2/tiny_mce/plugins/filemanager/files/4281670/aakpro/algebra/alg1/alg2/alg3/alg4/R%20for%20Stata%20Users.pdf 他にもぐぐるといっぱい出てくる。CRANには他にもマニュアル等が -http://cran.r-project.org/manuals.html -http://cran.r-project.org/other-docs.html あたりに置いてある。英語が多いが、日本語・中国語などのもあり。本については -R本リスト http://www.okadajp.org/RWiki/?R%E6%9C%AC%E3%83%AA%E3%82%B9%E3%83%88 を参照。 **データの操作 [#be197b63] ***データの読み込み [#cb194b23] 「data.csv」というcsvファイルを「dataframe」という名前で読み込む。 dataframe <- read.csv("data.csv", stringsAsFactors = FALSE) ***データの書き出し [#p2b55854] data.csvという名前で保存する場合、以下のようにする。 write.table(dataframe, "data.csv", sep=",", na="", quote = T, col.names = T, row.names = F, append = F) ***データの抽出 [#r46d8a1a] column列が「hoge」となっている行を抽出。 dataframe2 <- subset(dataframe, column == "hoge") ***データフレームの指定 [#zf4ac8e8] -「with」という関数を使うと、関数中で使うデータフレーム名を1回書くだけで済む。 with(dataframe, ・・・) -回帰ではdataオプションをつけられる。 kaiki.kekka <- lm(y ~ x, data = dataframe) -attach(dataframe)とdetach(dataframe)の間ではデータフレームが固定される。 ***カテゴリカルデータ [#vb4afa6a] アンケートデータでは数値自体の意味がないことが多い。 n <- ncol(origdata) idx <- 1:n factordata <- lapply(origdata[idx], as.factor) ***参照 [#i65096ba] -44. データの加工と抽出 http://cse.naro.affrc.go.jp/takezawa/r-tips/r/44.html -データフレームTips大全 http://www.okada.jp.org/RWiki/?%A5%C7%A1%BC%A5%BF%A5%D5%A5%EC%A1%BC%A5%E0Tips%C2%E7%C1%B4 -R: データ出力 http://www.is.titech.ac.jp/~mase/mase/html.jp/temp/write.table.jp.html **欠損値の処理 [#d3431c69] ***参照 [#rb7c6cfb] -[R] 欠損値を1つでも含む行を抽出 https://tam07pb915.wordpress.com/2017/02/18/filter-na-rows/ -欠損値(NA)を含むデータの抽出 https://github.com/YokohamaR/yokohama.r/issues/8 -すっからかん(欠損値しかない)の列を削除して完全データにしたい http://uribo.hatenablog.com/entry/2017/05/18/070548 -RでNAを含む列を簡単に削除したい https://qiita.com/kiyokoichi/items/3e2f030e7255a2ecdba6 -RのモダンなNA処理まとめ https://qiita.com/five-dots/items/361a42baf1e94edf5846 -Rで欠損値の有無を判定する函数 anyNA() https://id.fnshr.info/2014/04/14/anyna/ **空白の処理 [#a71ab7c9] 「gsub」を使う。 ***参照 [#r1a05845] -http://a-habakiri.hateblo.jp/entry/2016/12/21/212329 -http://anagumat.hateblo.jp/entry/2015/01/22/212534 **プログラミング [#ccc99822] ***演算子 [#t4fc881e] -R-Sourse 28. 演算子 http://cse.naro.affrc.go.jp/takezawa/r-tips/r/28.html ***多重ループ [#a442b64b] 「expand.grid」や「outer」を使うといいらしい。 -参照 http://d.hatena.ne.jp/teramonagi/20110330/1301486306 **分散分析 [#af68a5be] -http://mat.isc.chubu.ac.jp/R/tech.html **Wilcoxson検定(Mann-Whitney検定) [#ffebedb3] 標準のwilcox.testは近似計算になるらしいので、 install.packages("exactRankTests") library(exactRankTests) wilcox.exact(A群,B群) のようにすると正確な値が出る。~ これも古くなったらしく、代わりに install.packages("coin") library(coin) wilcox_test(c(A群,y) ~ factor(c(rep("A群",length(A群)),rep("B群",length(B群)))), distribution = "exact") とするらしい。 -参照 http://oku.edu.mie-u.ac.jp/~okumura/stat/wmw.html **カイ二乗検定 [#cfa3fed6] dataframeのvar1とvar2でカイ二乗検定したい場合、まず「xtabs」で分割表(クロス表)に集計する。分割表をMtrxとすると、以下のようになる(「addmargins」で合計欄を付加して表示させている)。 Mtrx <- xtabs(~var1 + var2, data = dataframe) addmargins(Mtrx) カイ二乗検定は「chisq.test」で分割表(行列形式)を指定してやる(使用するのは合計のない方)。 chisq.test(Mtrx) ***参照 [#a4be2c06] -http://sudori.info/stat/stat_contigency_table.html -http://monge.tec.fukuoka-u.ac.jp/r_analysis/dataframe_category04.html -http://monge.tec.fukuoka-u.ac.jp/r_analysis/data_crosstable10.html **計量経済 [#a5f1c39e] 分析毎に必要なパッケージ類が -CRAN Task Views https://www.trifields.jp/r-cran-task-views-639 でまとめられているので、これをインストールすれば楽。計量経済学のためには -CRAN Task View: Econometrics https://www.trifields.jp/r-cran-task-view-computational-econometrics-699 を入れる。入れ方は install.packages("ctv") library(ctv) install.views("Econometrics") でおけ。 -Rでエコノメトリクス http://www.okada.jp.org/RWiki/?R%A4%C7%A5%A8%A5%B3%A5%CE%A5%E1%A5%C8%A5%EA%A5%AF%A5%B9 -Rを使って計量経済分析 http://www.sugi-shun.com/econwiki/index.php?R%A4%F2%BB%C8%A4%C3%A4%C6%B7%D7%CE%CC%B7%D0%BA%D1%CA%AC%C0%CF -統計パッケージR http://hnami.or.tv/m2/index.php/%E7%B5%B1%E8%A8%88%E3%83%91%E3%83%83%E3%82%B1%E3%83%BC%E3%82%B8R ***Robustな標準誤差 [#xd9fb4af] 以下のように書く。 kaiki <- lm(y ~ x1 + x2 + x3, data = hogedata) coeftest(kaiki, vcov=vcovHC(kaiki, type = "HC1")) オプションのデフォルトはHC3。HC1にすると「回帰では」Stataと同じ結果を得る(Stataではregでvce(robust)オプション)。 -参照 --http://cran.r-project.org/web/packages/sandwich/sandwich.pdf --http://web.econ.keio.ac.jp/staff/hk/ecm2/resume/Rintro.pdf ***順序Logit [#a23040dd] summary(kaiki)だとt値しか出力してくれないので、screenregで有意かどうかを*で出している。 library(MASS) kaiki <- polr(y ~ x1 + x2 + x3, data = hogedata, method = "logistic") library(texreg) screenreg(kaiki) -参照 --https://qiita.com/watanta/items/7568f9d1d93d1094aee6 --https://qiita.com/malimo1024/items/ef008742ba7b4f33fe80 --http://ill-identified.hatenablog.com/entry/2014/01/28/214814 ***パネルデータ分析 [#i95270a0] plmを使う。モデルはwithin, random, ht, between, pooling, fdを指定できる。ランダム効果モデルではswar(標準), amemiya, walhus, nerlove, kinlaの5つを指定できる。 library(plm) outcome <- plm(y ~ x1 + x2, data = hoge, model = "random", random.method = "amemiya") のように書く。 -参照 --http://cran.r-project.org/web/packages/plm/plm.pdf --http://fukunan-blog.cocolog-nifty.com/fukunanblog/2009/06/r-bf15.html --http://hnami.or.tv/d/index.php?%A5%D1%A5%CD%A5%EB%A5%C7%A1%BC%A5%BF%CA%AC%C0%CF ***欠損値について [#q2e63bea] -http://d.hatena.ne.jp/syou6162/20070702/1183349437 -http://cse.naro.affrc.go.jp/takezawa/r-tips/r/18.html ***分析結果の出力 [#q3ea8355] -http://rottenpop.wordpress.com/2010/11/19/r%E3%81%A7%E9%87%8D%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90%EF%BC%88%E4%BD%9C%E8%A1%A8%EF%BC%89/ -http://www.tufs.ac.jp/ts/personal/corpuskun/wiki/index.php?R%A4%CE%A5%E1%A5%E2 **ログの保存 [#k8d20e34] ファイル - ファイルの保存 で保存できる。 **わかりやすく書くために [#x4002305] -Google's R Style Guide の翻訳 http://www.okadajp.org/RWiki/?Google's%20R%20Style%20Guide **ChromebookでR [#bdf45e3e] LinuxでRをインストールすればいいが、RStudioまで入れれば見た目もWindowsで動かすのと変わりない。ただし、パッケージのインストールには(コンパイル作業があるようで)Windowsより時間がかかる可能性がある。時間があるときにパッケージのインストールだけやっておくのがよさそう。 -ChromebookのLinuxにRStudio Desktopをインストールしてみた 20240208 https://www.youtube.com/watch?v=MazQiLXnJQ8 これの通りでできる。ただし、追加パッケージで入らないのがある(tidyverseとか)ので、 -R package の devtools をubuntuにインストールした時に発生したエラー ~ had non-zero exit status を解決する。 https://qiita.com/Yuuki-Osada/items/1f50c3e865ba4ef0d37f を参考に。 > 実は、丁寧に解決策の案を提示してくれています。~ 解決策の案に従って、足りていないソフトウェアをインストールしましょう。~ これを何度か繰り返せば問題なくインストールできました。~ 以下、devtoolsのインストールエラーを解決するためにインストールした時のコマンドです。 > sudo apt install libssl-dev libfontconfig1-dev libcurl4-openssl-dev libxml2-dev~ sudo apt install libharfbuzz-dev libfribidi-dev~ sudo apt install libfreetype6-dev libpng-dev libtiff5-dev libjpeg-dev **その他 [#r005c175] 適当なリンク。 -Rによるデータ解析 http://homepage2.nifty.com/nandemoarchive/sas_r_excel/mokuji_r.htm -Dataninja http://dataninja.wordpress.com/ -実践! Rで学ぶ統計解析の基礎(@IT) ++Rは統計解析のブッシュナイフだ https://www.atmarkit.co.jp/ait/articles/1007/21/news096.html ++Rで実践する統計的検定の初歩 https://www.atmarkit.co.jp/ait/articles/1008/04/news090.html ++Rによるオープン・データの可視化(1) https://www.atmarkit.co.jp/ait/articles/1008/20/news092.html ++Rによるオープン・データの可視化(2) https://www.atmarkit.co.jp/ait/articles/1009/02/news119.html ++インターリュード: TwitterとR https://www.atmarkit.co.jp/ait/articles/1009/15/news123.html ++夏の異常気象をオープン・データで確認 https://www.atmarkit.co.jp/ait/articles/1010/04/news108.html ++大相撲のアノーマリー (1) https://www.atmarkit.co.jp/ait/articles/1012/07/news103.html ++大相撲のアノーマリー (2) https://www.atmarkit.co.jp/ait/articles/1102/17/news098.html -実践!WebマーケターのためのR入門 ++とっつきにくいけど実はエクセル以上に賢いヤツ フリー統計解析ソフトウェア「R」を触ってみよう http://markezine.jp/article/detail/19808 ++Rで本格的に分析を始める前に「必ず」確認しておきたいこと http://markezine.jp/article/detail/20069 ++時系列データと箱ひげ図を利用して、ちゃちゃっとデータを分解し変動要因を特定しよう http://markezine.jp/article/detail/20427 ++Rのパワーアップキットを使ってイケてるグラフをサクッと作成しよう http://markezine.jp/article/detail/20541 ++ダミー変数を使って上手にデータをまとめ、グループごとの特徴を把握しよう http://markezine.jp/article/detail/20790 -caretパッケージのdummyVarsによるダミー変数の作り方 http://estrellita.hatenablog.com/entry/2014/07/29/091448 -生産年齢人口が減るとデフレになる? http://tacmasi.blogspot.com/2010/10/blog-post.html 世界銀行のデータを用いて人口-物価や人口-貨幣量の相関を分析。 -裏 RjpWiki http://blog.goo.ne.jp/r-de-r -マイクロソフトが「Microsoft R Server」を公開 http://www.atmarkit.co.jp/ait/articles/1601/08/news147.html
タイムスタンプを変更しない
*R [#v371104c] フリーの統計解析ソフト。普通にこの手のソフトを買うと10万円とかとられるので懐にやさしい([[stata価格>https://www.lightstone.co.jp/stata/pricelist.html]], [[EViews価格>https://www.lightstone.co.jp/eviews/prices_aca.html]])。かなり高機能。 **ダウンロード [#wa12af2f] 以下の[[CRAN>http://cran.r-project.org/]](The Comprehensive R Archive Network)ミラーのうち、お好きなところで(提供をやめてしまったところが多い)。 -山形大学 https://ftp.yz.yamagata-u.ac.jp/pub/cran/ -RStudio https://cran.rstudio.com **インストール・使い方 [#k26f922c] 以下を参照。「R-x.x.x-win.exe」のような名前のファイル(Windowsの場合)をダウンロードして実行するだけ。 -R-Tips http://cse.naro.affrc.go.jp/takezawa/r-tips/r.html -RjpWiki http://www.okada.jp.org/RWiki/?RjpWiki まず、デスクトップ用のアイコンを右クリック-プロパティで起動オプションを設定しておこう。「リンク先」の最後に「 --no-save」を追加すると、最後の保存確認が省略される。「作業フォルダー」はデータやスクリプトを置く場所になるので、適当に設定しておこう。 次に、メニューの 編集-GUIプリファレンス からFONTをMS Gothicに変更してSave...を押すと、Rconsoleというファイルが保存される。これをテキストエディターで編集して MDIsize = 800*600+100+50 のような行を追加する。これで起動時のウィンドウサイズ・位置を調整できる(「800*600」がサイズ、「+100+50」がウィンドウの左上の位置)。 追加パッケージのダウンロード先(CRANミラー)の設定はC:\Program Files\R\R-x.x.x\etc(例)にある「Rprofile.site」に local({r <- getOption("repos") r["CRAN"] <- "https://cran.ism.ac.jp/" options(repos=r)}) と追記しておく(統計数理研究所にアクセスする場合)。 -参考 http://www.agr.nagoya-u.ac.jp/~seitai/document/R2009/Rsettings.pdf また、RコマンダーというGUI環境が用意されているので、使いたい場合は install.packages("Rcmdr") library(Rcmdr) のように入力(インストールは初めてのときのみ)するとRコマンダーが起動する。最初の起動には分析に必要なパッケージを沢山ダウンロード&インストールするので、多少時間がかかる。Rコマンダーについては -〔GUI 版R〕R Commander の説明書 http://cwoweb2.bai.ne.jp/~jgb11101/files/R-commander.pdf -Rcmdrの機能 http://www.okada.jp.org/RWiki/?Rcmdr%A4%CE%B5%A1%C7%BD を参照。 **オンライン・ドキュメント(PDF) [#cd7e9049] -R-intro.の日本語訳 http://phi.med.gunma-u.ac.jp/swtips/R-jp-docs/R-intro-170.jp.pdf -統計分析ソフトウェアRの使用法 http://www.otaru-uc.ac.jp/~nisiyama/Documents/rmanual.pdf -Rによる統計解析の基礎(同名の書籍の草稿) http://phi.med.gunma-u.ac.jp/statlib/stat.pdf -Rによる保健医療データ解析演習 http://phi.med.gunma-u.ac.jp/msb/medstatbook.pdf -Rノート:データ解析とグラフィックスのためのプログラミング環境 http://www.geocities.co.jp/HiTeens/5433/R/Rfiles/R-jp.pdf -心理学データ解析のための統計ソフト R のミニミニマニュアル http://www1.gifu-u.ac.jp/~s_oga/Rmanual.pdf -Econometrics in R http://cran.r-project.org/doc/contrib/Farnsworth-EconometricsInR.pdf -R、R言語、R環境・・・・・・ http://www1.doshisha.ac.jp/~mjin/R/ -RjpWiki アーカイブス http://www.okada.jp.org/RWiki/?RjpWiki%20%A5%A2%A1%BC%A5%AB%A5%A4%A5%D6%A5%B9 -maselab-R- http://www.is.titech.ac.jp/is-wiki/?maselab%2FR#teefddcd -R for Stata Users http://uqu.edu.sa/files2/tiny_mce/plugins/filemanager/files/4281670/aakpro/algebra/alg1/alg2/alg3/alg4/R%20for%20Stata%20Users.pdf 他にもぐぐるといっぱい出てくる。CRANには他にもマニュアル等が -http://cran.r-project.org/manuals.html -http://cran.r-project.org/other-docs.html あたりに置いてある。英語が多いが、日本語・中国語などのもあり。本については -R本リスト http://www.okadajp.org/RWiki/?R%E6%9C%AC%E3%83%AA%E3%82%B9%E3%83%88 を参照。 **データの操作 [#be197b63] ***データの読み込み [#cb194b23] 「data.csv」というcsvファイルを「dataframe」という名前で読み込む。 dataframe <- read.csv("data.csv", stringsAsFactors = FALSE) ***データの書き出し [#p2b55854] data.csvという名前で保存する場合、以下のようにする。 write.table(dataframe, "data.csv", sep=",", na="", quote = T, col.names = T, row.names = F, append = F) ***データの抽出 [#r46d8a1a] column列が「hoge」となっている行を抽出。 dataframe2 <- subset(dataframe, column == "hoge") ***データフレームの指定 [#zf4ac8e8] -「with」という関数を使うと、関数中で使うデータフレーム名を1回書くだけで済む。 with(dataframe, ・・・) -回帰ではdataオプションをつけられる。 kaiki.kekka <- lm(y ~ x, data = dataframe) -attach(dataframe)とdetach(dataframe)の間ではデータフレームが固定される。 ***カテゴリカルデータ [#vb4afa6a] アンケートデータでは数値自体の意味がないことが多い。 n <- ncol(origdata) idx <- 1:n factordata <- lapply(origdata[idx], as.factor) ***参照 [#i65096ba] -44. データの加工と抽出 http://cse.naro.affrc.go.jp/takezawa/r-tips/r/44.html -データフレームTips大全 http://www.okada.jp.org/RWiki/?%A5%C7%A1%BC%A5%BF%A5%D5%A5%EC%A1%BC%A5%E0Tips%C2%E7%C1%B4 -R: データ出力 http://www.is.titech.ac.jp/~mase/mase/html.jp/temp/write.table.jp.html **欠損値の処理 [#d3431c69] ***参照 [#rb7c6cfb] -[R] 欠損値を1つでも含む行を抽出 https://tam07pb915.wordpress.com/2017/02/18/filter-na-rows/ -欠損値(NA)を含むデータの抽出 https://github.com/YokohamaR/yokohama.r/issues/8 -すっからかん(欠損値しかない)の列を削除して完全データにしたい http://uribo.hatenablog.com/entry/2017/05/18/070548 -RでNAを含む列を簡単に削除したい https://qiita.com/kiyokoichi/items/3e2f030e7255a2ecdba6 -RのモダンなNA処理まとめ https://qiita.com/five-dots/items/361a42baf1e94edf5846 -Rで欠損値の有無を判定する函数 anyNA() https://id.fnshr.info/2014/04/14/anyna/ **空白の処理 [#a71ab7c9] 「gsub」を使う。 ***参照 [#r1a05845] -http://a-habakiri.hateblo.jp/entry/2016/12/21/212329 -http://anagumat.hateblo.jp/entry/2015/01/22/212534 **プログラミング [#ccc99822] ***演算子 [#t4fc881e] -R-Sourse 28. 演算子 http://cse.naro.affrc.go.jp/takezawa/r-tips/r/28.html ***多重ループ [#a442b64b] 「expand.grid」や「outer」を使うといいらしい。 -参照 http://d.hatena.ne.jp/teramonagi/20110330/1301486306 **分散分析 [#af68a5be] -http://mat.isc.chubu.ac.jp/R/tech.html **Wilcoxson検定(Mann-Whitney検定) [#ffebedb3] 標準のwilcox.testは近似計算になるらしいので、 install.packages("exactRankTests") library(exactRankTests) wilcox.exact(A群,B群) のようにすると正確な値が出る。~ これも古くなったらしく、代わりに install.packages("coin") library(coin) wilcox_test(c(A群,y) ~ factor(c(rep("A群",length(A群)),rep("B群",length(B群)))), distribution = "exact") とするらしい。 -参照 http://oku.edu.mie-u.ac.jp/~okumura/stat/wmw.html **カイ二乗検定 [#cfa3fed6] dataframeのvar1とvar2でカイ二乗検定したい場合、まず「xtabs」で分割表(クロス表)に集計する。分割表をMtrxとすると、以下のようになる(「addmargins」で合計欄を付加して表示させている)。 Mtrx <- xtabs(~var1 + var2, data = dataframe) addmargins(Mtrx) カイ二乗検定は「chisq.test」で分割表(行列形式)を指定してやる(使用するのは合計のない方)。 chisq.test(Mtrx) ***参照 [#a4be2c06] -http://sudori.info/stat/stat_contigency_table.html -http://monge.tec.fukuoka-u.ac.jp/r_analysis/dataframe_category04.html -http://monge.tec.fukuoka-u.ac.jp/r_analysis/data_crosstable10.html **計量経済 [#a5f1c39e] 分析毎に必要なパッケージ類が -CRAN Task Views https://www.trifields.jp/r-cran-task-views-639 でまとめられているので、これをインストールすれば楽。計量経済学のためには -CRAN Task View: Econometrics https://www.trifields.jp/r-cran-task-view-computational-econometrics-699 を入れる。入れ方は install.packages("ctv") library(ctv) install.views("Econometrics") でおけ。 -Rでエコノメトリクス http://www.okada.jp.org/RWiki/?R%A4%C7%A5%A8%A5%B3%A5%CE%A5%E1%A5%C8%A5%EA%A5%AF%A5%B9 -Rを使って計量経済分析 http://www.sugi-shun.com/econwiki/index.php?R%A4%F2%BB%C8%A4%C3%A4%C6%B7%D7%CE%CC%B7%D0%BA%D1%CA%AC%C0%CF -統計パッケージR http://hnami.or.tv/m2/index.php/%E7%B5%B1%E8%A8%88%E3%83%91%E3%83%83%E3%82%B1%E3%83%BC%E3%82%B8R ***Robustな標準誤差 [#xd9fb4af] 以下のように書く。 kaiki <- lm(y ~ x1 + x2 + x3, data = hogedata) coeftest(kaiki, vcov=vcovHC(kaiki, type = "HC1")) オプションのデフォルトはHC3。HC1にすると「回帰では」Stataと同じ結果を得る(Stataではregでvce(robust)オプション)。 -参照 --http://cran.r-project.org/web/packages/sandwich/sandwich.pdf --http://web.econ.keio.ac.jp/staff/hk/ecm2/resume/Rintro.pdf ***順序Logit [#a23040dd] summary(kaiki)だとt値しか出力してくれないので、screenregで有意かどうかを*で出している。 library(MASS) kaiki <- polr(y ~ x1 + x2 + x3, data = hogedata, method = "logistic") library(texreg) screenreg(kaiki) -参照 --https://qiita.com/watanta/items/7568f9d1d93d1094aee6 --https://qiita.com/malimo1024/items/ef008742ba7b4f33fe80 --http://ill-identified.hatenablog.com/entry/2014/01/28/214814 ***パネルデータ分析 [#i95270a0] plmを使う。モデルはwithin, random, ht, between, pooling, fdを指定できる。ランダム効果モデルではswar(標準), amemiya, walhus, nerlove, kinlaの5つを指定できる。 library(plm) outcome <- plm(y ~ x1 + x2, data = hoge, model = "random", random.method = "amemiya") のように書く。 -参照 --http://cran.r-project.org/web/packages/plm/plm.pdf --http://fukunan-blog.cocolog-nifty.com/fukunanblog/2009/06/r-bf15.html --http://hnami.or.tv/d/index.php?%A5%D1%A5%CD%A5%EB%A5%C7%A1%BC%A5%BF%CA%AC%C0%CF ***欠損値について [#q2e63bea] -http://d.hatena.ne.jp/syou6162/20070702/1183349437 -http://cse.naro.affrc.go.jp/takezawa/r-tips/r/18.html ***分析結果の出力 [#q3ea8355] -http://rottenpop.wordpress.com/2010/11/19/r%E3%81%A7%E9%87%8D%E5%9B%9E%E5%B8%B0%E5%88%86%E6%9E%90%EF%BC%88%E4%BD%9C%E8%A1%A8%EF%BC%89/ -http://www.tufs.ac.jp/ts/personal/corpuskun/wiki/index.php?R%A4%CE%A5%E1%A5%E2 **ログの保存 [#k8d20e34] ファイル - ファイルの保存 で保存できる。 **わかりやすく書くために [#x4002305] -Google's R Style Guide の翻訳 http://www.okadajp.org/RWiki/?Google's%20R%20Style%20Guide **ChromebookでR [#bdf45e3e] LinuxでRをインストールすればいいが、RStudioまで入れれば見た目もWindowsで動かすのと変わりない。ただし、パッケージのインストールには(コンパイル作業があるようで)Windowsより時間がかかる可能性がある。時間があるときにパッケージのインストールだけやっておくのがよさそう。 -ChromebookのLinuxにRStudio Desktopをインストールしてみた 20240208 https://www.youtube.com/watch?v=MazQiLXnJQ8 これの通りでできる。ただし、追加パッケージで入らないのがある(tidyverseとか)ので、 -R package の devtools をubuntuにインストールした時に発生したエラー ~ had non-zero exit status を解決する。 https://qiita.com/Yuuki-Osada/items/1f50c3e865ba4ef0d37f を参考に。 > 実は、丁寧に解決策の案を提示してくれています。~ 解決策の案に従って、足りていないソフトウェアをインストールしましょう。~ これを何度か繰り返せば問題なくインストールできました。~ 以下、devtoolsのインストールエラーを解決するためにインストールした時のコマンドです。 > sudo apt install libssl-dev libfontconfig1-dev libcurl4-openssl-dev libxml2-dev~ sudo apt install libharfbuzz-dev libfribidi-dev~ sudo apt install libfreetype6-dev libpng-dev libtiff5-dev libjpeg-dev **その他 [#r005c175] 適当なリンク。 -Rによるデータ解析 http://homepage2.nifty.com/nandemoarchive/sas_r_excel/mokuji_r.htm -Dataninja http://dataninja.wordpress.com/ -実践! Rで学ぶ統計解析の基礎(@IT) ++Rは統計解析のブッシュナイフだ https://www.atmarkit.co.jp/ait/articles/1007/21/news096.html ++Rで実践する統計的検定の初歩 https://www.atmarkit.co.jp/ait/articles/1008/04/news090.html ++Rによるオープン・データの可視化(1) https://www.atmarkit.co.jp/ait/articles/1008/20/news092.html ++Rによるオープン・データの可視化(2) https://www.atmarkit.co.jp/ait/articles/1009/02/news119.html ++インターリュード: TwitterとR https://www.atmarkit.co.jp/ait/articles/1009/15/news123.html ++夏の異常気象をオープン・データで確認 https://www.atmarkit.co.jp/ait/articles/1010/04/news108.html ++大相撲のアノーマリー (1) https://www.atmarkit.co.jp/ait/articles/1012/07/news103.html ++大相撲のアノーマリー (2) https://www.atmarkit.co.jp/ait/articles/1102/17/news098.html -実践!WebマーケターのためのR入門 ++とっつきにくいけど実はエクセル以上に賢いヤツ フリー統計解析ソフトウェア「R」を触ってみよう http://markezine.jp/article/detail/19808 ++Rで本格的に分析を始める前に「必ず」確認しておきたいこと http://markezine.jp/article/detail/20069 ++時系列データと箱ひげ図を利用して、ちゃちゃっとデータを分解し変動要因を特定しよう http://markezine.jp/article/detail/20427 ++Rのパワーアップキットを使ってイケてるグラフをサクッと作成しよう http://markezine.jp/article/detail/20541 ++ダミー変数を使って上手にデータをまとめ、グループごとの特徴を把握しよう http://markezine.jp/article/detail/20790 -caretパッケージのdummyVarsによるダミー変数の作り方 http://estrellita.hatenablog.com/entry/2014/07/29/091448 -生産年齢人口が減るとデフレになる? http://tacmasi.blogspot.com/2010/10/blog-post.html 世界銀行のデータを用いて人口-物価や人口-貨幣量の相関を分析。 -裏 RjpWiki http://blog.goo.ne.jp/r-de-r -マイクロソフトが「Microsoft R Server」を公開 http://www.atmarkit.co.jp/ait/articles/1601/08/news147.html
テキスト整形のルールを表示する