「Overall」では R の環境を利用するために必要な基本的な事項について扱います。個々のパッケージの使い方や分析手法に関するTips的な事項は Project Cabinet blog にて扱います。
データ分析勉強会 で分析演習を行う際には主に R Commander(以降、Rcmdr) パッケージを利用してきました。 Rcmdr はコードを書かなくても分析ができるので敷居が低く便利ではありますが、できることは残念ながら限られています。また、分析の再現可能性の観点から見ても好ましくありません。本来 R でできる様々な分析を行うには Rcmdr から離れ R のスクリプトの世界に足を踏み入れる必要があります。
R のスクリプトを書くにはマルチプラットフォーム対応の RStudio Desktop を用いるのが現時点では最も便利です。 R / RStudio で出来ることは
です。2017年度の データ分析勉強会 のテキストである 統計学基礎 の第1章の中から具体的な例を上げてみましょう。
R/RStudioで出来ることの例 | 利用パッケージ例 |
---|---|
度数分布表の作成と表示 | dplyr, knitr, DT |
ローレンツ曲線の描画とジニ係数の計算 | ineq |
カラフルで分かりやすいグラフ | ggplot2 |
クロス集計表の作成と表示 | dplyr, knitr, DT |
時系列分析 | TTR |
その他、以下のようなこともできるようになります。
R/RStudioで出来ることの例 | 利用パッケージ例 |
---|---|
高度なデータハンドリング | tidyverse |
インタラクティブなレポート | rmarkdown |
Webページの作成 | rmarkdown |
電子ブックの作成 | bookdown |
データスクレイピング | tidyverse |
自然言語処理 | RMeCab |
ベイズ統計 | rstan, mcmc |
機械学習 | randomForest |
深層学習(ディープラーニング) | h2o |
R でどのようなことが出来るようになるのかは CRAN Task View で公開されていますので興味があればのぞいてみてください。