トップ 差分 一覧 ソース 検索 ヘルプ RSS ログイン 印刷

散布図

auditR

散布図を描く

散布図はデータの中の最低2つの項目を縦軸横軸にプロットすることで、2変数の関係性を全体的に眺めることができる。

分析では最初に必ず使いたい。

ggplot2::ggplot(data = df, mapping = aes(x = X, y = Y) + geom_point()

XY軸には通常数値型の項目が来るが、プロットされる点を、曜日とか性別などのカテゴリで分けたい場合には、aes()属性に、colorやshapeを指定すると、色や点の種類で分類できる。

但し、color/shapeのオプションは6種類が上限で、それ以上は警告メッセージが出てくるので、個別に指定する。

+ scale_shape_manual(value = 変数の数) + scale_color_manual(value = 変数の数)

上記で変数を指定する場合、データと望む変数とをリンクさせておかないと、入力した順序で割り当てられてしまい牽強さが落ちる。引用

g + scale_color_manual(
 values = c(Gentoo = "cyan4", Chinstrap = "purple", Adelie = "darkorange"),
 labels = c(Chinstrap = "ヒゲ", Gentoo = "ジェンツー", Adelie = "アデリー")
 ) + labs(title = "正しく設定できたグラフ", color = "種")

点をずらす

データ数が増えてくるとプロットする点が重なってしまい、データの多さが実際より少なく表現されてしまう。

このため、正確なプロットよりも少しだけ点をずらすことで対応する。

geom_point(position = "jitter")

なお、これは、

geom_jitter()

でも対応できる。


Last updated 2021-07-29 | auditR (c) N.Nawata