散布図を描く
散布図はデータの中の最低2つの項目を縦軸横軸にプロットすることで、2変数の関係性を全体的に眺めることができる。
分析では最初に必ず使いたい。
ggplot2::ggplot(data = df, mapping = aes(x = X, y = Y) + geom_point()
XY軸には通常数値型の項目が来るが、プロットされる点を、曜日とか性別などのカテゴリで分けたい場合には、aes()属性に、colorやshapeを指定すると、色や点の種類で分類できる。
但し、color/shapeのオプションは6種類が上限で、それ以上は警告メッセージが出てくるので、個別に指定する。
+ scale_shape_manual(value = 変数の数) + scale_color_manual(value = 変数の数)
上記で変数を指定する場合、データと望む変数とをリンクさせておかないと、入力した順序で割り当てられてしまい牽強さが落ちる。引用
g + scale_color_manual( values = c(Gentoo = "cyan4", Chinstrap = "purple", Adelie = "darkorange"), labels = c(Chinstrap = "ヒゲ", Gentoo = "ジェンツー", Adelie = "アデリー") ) + labs(title = "正しく設定できたグラフ", color = "種")
点をずらす
データ数が増えてくるとプロットする点が重なってしまい、データの多さが実際より少なく表現されてしまう。
このため、正確なプロットよりも少しだけ点をずらすことで対応する。
geom_point(position = "jitter")
なお、これは、
geom_jitter()
でも対応できる。
Last updated 2021-07-29 | auditR (c) N.Nawata