ワンホットエンコーディングのことをダミー変数という人もいるよう。
ワンホットエンコーディングとは、ファクタ値を元に項目名を用意して、0と1を割り当てることで表現するもの。
例えば、
color = c("赤", "黄", "緑", "青", "白")
というデータをワンホットでエンコードすると、
color_赤, color_黄, color_緑, color_青, color_白
1,0,0,0,0
0,1,0,0,0
0,0,1,0,0
0,0,0,1,0
0,0,0,0,1
のようになる。
makedummiesとかdummiesといったパッケージがあるよう。
- 参考
Last updated 2021-06-16 | auditR (c) N.Nawata