ダミー変数

ダミー変数をつくる

ワンホットエンコーディングのことをダミー変数という人もいるよう。

ワンホットエンコーディングとは、ファクタ値を元に項目名を用意して、0と1を割り当てることで表現するもの。

例えば、

color = c("赤", "黄", "緑", "青", "白")

というデータをワンホットでエンコードすると、

color_赤, color_黄, color_緑, color_青, color_白
1,0,0,0,0
0,1,0,0,0
0,0,1,0,0
0,0,0,1,0
0,0,0,0,1

のようになる。

makedummiesとかdummiesといったパッケージがあるよう。

参考