本ページでは箱ひげ図とそのサマリの関係を実際にコードを動かしながら確認できます。上段のWEBR STATUS
がReady!
になれば実行できます。
箱ひげ図の描き方には様々な方法があります。Rの箱ひげ図はテューキーの箱ひげ図と呼ばれるもので、ひげの位置が必ずしも\(Q_{1/4} - 1.5 \times IQR, Q_{3/4} + 1.5 \times IQR\)にならない場合がある点に注意してください。では、実際にコードを実行しながら確認してみましょう。
サンプルデータセット
Rに組み込まれているiris
データセットのSepal.Width
(萼片の幅)をサンプルデータとして用います。
箱ひげ図とそのサマリ
[Run Code]
を順にクリックすることでRのコードを実行できます。
最初に箱ひげ図を描きます。
次に描いた箱ひげ図のサマリを確認します。
返り値 | 説明(返り値の内容) |
---|---|
stats |
下ひげ極値、第一・二・三四分位点、上ひげ極値 |
n |
(グループ毎の)データ数 |
conf |
信頼区間(\(Q_2 \pm 1.58 \times \frac{IQR}{\sqrt n}\)) |
out |
外れ値(インデックスではなくデータの値) |
group |
外れ値が属するグループ番号 |
names |
グループ名(層別水準名) |
次に下/上側極値、第一/第三四分位点、第二四分位点(中央値)(stats
)が箱ひげ図の中でどの位置にあるのかを確認します。
参考までに信頼区間(coef
)を確認しておきます。
下/上側極値、第一・二・三四分位点(stats
)と五数要約(fivenum()
)の関係を確認します。
五数要約は「最小値, 第一四分位点, 第二四分位点(中央値), 第三四分位点, 最大値」を求めるものですが、R Commanderにある要約統計量(numSummary()
による分位数)とは異なる値になる場合がありますので注意が必要です。
最後に\(Q_{1/4} - 1.5 \times IQR, Q_{3/4} + 1.5 \times IQR\)とひげの位置を確認します。
以上よりRにおける箱ひげ図(boxplot()
)では、ひげが必ずしも\(Q_{1/4} - 1.5 \times IQR, Q_{3/4} + 1.5 \times IQR\)と一致しない場合があることが分かります。