- 追加された行はこのように表示されます。
- 削除された行は
このように表示されます。
!ヒストグラムを描く
データを入手したら、いきなり分析に入るのではなく、全体像を把握するのがお作法だが、特に統計量を導く前にデータがどのように分布しているのかを知っておくことは、何をさておき重要である。
:hist(数値ベクトル):で、単純なヒストグラムを描くことができる。設定はデフォルトだ。
特に横軸の表示レンジを指定したいときがある。
単純に、グラフの軸数を増やしたければ、その数を指定すればよい。
hist(数値フィールド, breaks=20) #20の区分でヒストグラムが描かれる
また、0円から1億円までを、20百万円刻みにしたいときは、breaksオプションを使い、
hist(数値フィールド, breaks=seq(0,100000000, 20000000))
とする。breaksオプションは、ベクトルで適当な値(不均衡な値も可能)を指定できる。
breaks=c(0, 100, 500, 2000, 10000)
監査では、稟議決裁基準(課長決裁、部長決裁、役員決裁、社長決裁など)を踏まえた金額レンジで分けたいときなどに使える。
また、plot=F オプションを指定(デフォルトはT)することで、グラフ表示ではなく表にすることも可能。
その他、xlim=c(下限値, 上限値), ylim=c(下限値, 上限値) で横軸、縦軸の表示の範囲を決めることができるが、全体観がなくなるので監査では特にそこを強調する理由がない限りはお勧めしない。
:Example:
hist(movies$runtime
, breaks=20
, xlim=c(90,220)
, main= "Distribution of Runtime"
, xlab="Runtime [-]"
, col="cyan"
, border="red"
)
!ヒストグラムについての注意
* ヒストグラムは、連続する値の分布をグラフの面積によって表現するもので、類似する棒グラフとは意味が異なる。棒グラフはカテゴリごとの数量を表現するもので、たとえば、「貧困層、低所得層、中間層、高所得層」という分類などによる表現で用いられる。
* ヒストグラムは度数帯の幅の取り方や、幅が「以上・未満」なのか「より上・以下」の違いによって、見え方や受ける印象が異なることがある。
:参照:
* boxplot()
{{category グラフ作成,データ要約}}