トップ 一覧 検索 ヘルプ RSS ログイン 印刷

外れ値の変更点

  • 追加された行はこのように表示されます。
  • 削除された行はこのように表示されます。
{{category 用語}}
!外れ値

多数のデータをヒストグラムで表現した場合、大きな集団が示す値の範囲とは外れたところに個々に少数のデータが存在することがある。集団から外れているということで、外れ値とされる。

外れ値は、統計では入力ミスや異質データの混入などの原因も考えられるので、探索が必要とされる。また、何らかの重要な特質を示す可能性が考えられるので、新たな「発見」の可能性もある。監査上はこれらの考え方は、そのまま誤謬や不正の可能性を検討する対象とされるだろうが、何を外れ値とするかは、監査人の判断事項で実務上は何らかの閾値を用いざるを得ない。

統計では、四分位数(箱ひげ図)を把握して第3四分位数と第2四分位数の値の差(=四分位範囲)の上側1.5倍、下側1.5倍の範囲に入らないデータを外れ値とする基準がある。あくまでも便宜上の方法論であり、外れ値とする絶対的な基準ではない。

*下側の外れ値<第1四分位数―1.5×四分位範囲 = 下側境界(lower fence)
*上側の外れ値>第3四分位数―1.5×四分位範囲 = 上側境界(upper fence)

参考 熊原・渡辺(2013)