トップ 差分 一覧 ソース 検索 ヘルプ RSS ログイン 印刷

外れ値

auditR

[用語]

外れ値

多数のデータをヒストグラムで表現した場合、大きな集団が示す値の範囲とは外れたところに個々に少数のデータが存在することがある。集団から外れているということで、外れ値とされる。

外れ値は、統計では入力ミスや異質データの混入などの原因も考えられるので、探索が必要とされる。また、何らかの重要な特質を示す可能性が考えられるので、新たな「発見」の可能性もある。監査上はこれらの考え方は、そのまま誤謬や不正の可能性を検討する対象とされるだろうが、何を外れ値とするかは、監査人の判断事項で実務上は何らかの閾値を用いざるを得ない。

統計では、四分位数(箱ひげ図)を把握して第3四分位数と第2四分位数の値の差(=四分位範囲)の上側1.5倍、下側1.5倍の範囲に入らないデータを外れ値とする基準がある。あくまでも便宜上の方法論であり、外れ値とする絶対的な基準ではない。

  • 下側の外れ値<第1四分位数―1.5×四分位範囲 = 下側境界(lower fence)
  • 上側の外れ値>第3四分位数―1.5×四分位範囲 = 上側境界(upper fence)

参考 熊原・渡辺(2013)


Last updated 2016-01-20 | auditR (c) N.Nawata