Try boxplot()

 本ページでは箱ひげ図とそのサマリの関係を実際にコードを動かしながら確認できます。上段のWEBR STATUSReady!になれば実行できます。

 箱ひげ図の描き方には様々な方法があります。Rの箱ひげ図はテューキーの箱ひげ図と呼ばれるもので、ひげの位置が必ずしも\(Q_{1/4} - 1.5 \times IQR, Q_{3/4} + 1.5 \times IQR\)にならない場合がある点に注意してください。では、実際にコードを実行しながら確認してみましょう。

サンプルデータセット

 Rに組み込まれているirisデータセットのSepal.Width(萼片の幅)をサンプルデータとして用います。

箱ひげ図とそのサマリ

 [Run Code]を順にクリックすることでRのコードを実行できます。
 最初に箱ひげ図を描きます。

 次に描いた箱ひげ図のサマリを確認します。

返り値 説明(返り値の内容)
stats 下ひげ極値、第一・二・三四分位点、上ひげ極値
n (グループ毎の)データ数
conf 信頼区間(\(Q_2 \pm 1.58 \times \frac{IQR}{\sqrt n}\)
out 外れ値(インデックスではなくデータの値)
group 外れ値が属するグループ番号
names グループ名(層別水準名)

 次に下/上側極値、第一/第三四分位点、第二四分位点(中央値)(stats)が箱ひげ図の中でどの位置にあるのかを確認します。

 参考までに信頼区間(coef)を確認しておきます。

 下/上側極値、第一・二・三四分位点(stats)と五数要約(fivenum())の関係を確認します。

 五数要約は「最小値, 第一四分位点, 第二四分位点(中央値), 第三四分位点, 最大値」を求めるものですが、R Commanderにある要約統計量(numSummary()による分位数)とは異なる値になる場合がありますので注意が必要です。

 最後に\(Q_{1/4} - 1.5 \times IQR, Q_{3/4} + 1.5 \times IQR\)とひげの位置を確認します。

 以上よりRにおける箱ひげ図(boxplot())では、ひげが必ずしも\(Q_{1/4} - 1.5 \times IQR, Q_{3/4} + 1.5 \times IQR\)と一致しない場合があることが分かります。