「Overall」では R の環境を利用するために必要な基本的な事項について扱います。個々のパッケージの使い方や分析手法に関するTips的な事項は Project Cabinet blog にて扱います。
 

RStudioを使おう

データ分析勉強会 で分析演習を行う際には主に R Commander(以降、Rcmdr) パッケージを利用してきました。 Rcmdr はコードを書かなくても分析ができるので敷居が低く便利ではありますが、できることは残念ながら限られています。また、分析の再現可能性の観点から見ても好ましくありません。本来 R でできる様々な分析を行うには Rcmdr から離れ R のスクリプトの世界に足を踏み入れる必要があります。
 
R のスクリプトを書くにはマルチプラットフォーム対応の RStudio Desktop を用いるのが現時点では最も便利です。 R / RStudio で出来ることは
 

  • R Comannderで出来ること全て
  • R Comannderに出来ないこと全て

 
です。2017年度の データ分析勉強会 のテキストである 統計学基礎 の第1章の中から具体的な例を上げてみましょう。
 

R/RStudioで出来ることの例 利用パッケージ例
度数分布表の作成と表示 dplyr, knitr, DT
ローレンツ曲線の描画とジニ係数の計算 ineq
カラフルで分かりやすいグラフ ggplot2
クロス集計表の作成と表示 dplyr, knitr, DT
時系列分析 TTR

 
その他、以下のようなこともできるようになります。
 

R/RStudioで出来ることの例 利用パッケージ例
高度なデータハンドリング tidyverse
インタラクティブなレポート rmarkdown
Webページの作成 rmarkdown
電子ブックの作成 bookdown
データスクレイピング tidyverse
自然言語処理 RMeCab
ベイズ統計 rstan, mcmc
機械学習 randomForest
深層学習(ディープラーニング) h2o

 
R でどのようなことが出来るようになるのかは CRAN Task View で公開されていますので興味があればのぞいてみてください。
 

千里の道も一歩から

「Basics」では R のスクリプトで処理が書けるようになるために順を追って基本的な事項を紹介していきます。
 

メニュー名 内容
RStudio Basics 環境の基本となる RStudio の使い方
R Markdown Basics 再現可能な分析を行う上で必須となる R Markdown について
R Basics R の基礎
Tidyverse Basics モダンな R プログラミングのコアとなる tidyverse シリーズについて

 

チュートリアル資料

チュートリアル資料は環境により動作が異なってしまうため現在公開停止中です。

 


Sampo Suzuki CC BY-NC-SA 4.0 , Sampo Suzuki [2019-05-10(JST)]