トップ 一覧 検索 ヘルプ RSS ログイン 印刷

ダミー変数の変更点

  • 追加された行はこのように表示されます。
  • 削除された行はこのように表示されます。
!ダミー変数をつくる

ワンホットエンコーディングのことをダミー変数という人もいるよう。

ワンホットエンコーディングとは、ファクタ値を元に項目名を用意して、0と1を割り当てることで表現するもの。

例えば、

color = c("赤", "黄", "緑", "青", "白")
 color = c("赤", "黄", "緑", "青", "白")

というデータをワンホットでエンコードすると、

 color_赤, color_黄, color_緑, color_青, color_白
 1,0,0,0,0
 0,1,0,0,0
 0,0,1,0,0
 0,0,0,1,0
 0,0,0,0,1

のようになる。

makedummiesとかdummiesといったパッケージがあるよう。

:参考:

* https://socinuit.hatenablog.com/entry/2019/02/16/000654
* https://yoshida931.hatenablog.com/entry/2018/07/19/175031