トップ 一覧 検索 ヘルプ RSS ログイン 印刷

康煕部首の変更点

  • 追加された行はこのように表示されます。
  • 削除された行はこのように表示されます。
!漢字のようで漢字ではない康煕部首

「こうきぶしゅ」と読むらしい。

時々、テキストを読んでいると特定の文字だけがサイズが違っていたりするのはこれのせいだったかも。

テキストマイニングには邪魔者なので正当な文字に置き換える必要がある。

Rで康煕部首を取り除くツールを探さねばなるまい。
Rで康煕部首を取り除いて元の漢字に変換するツールは、@uriboさんのzipanguパッケージに入っているツールが便利。

 zipangu::str_jnormalize()

* https://rdrr.io/github/uribo/zipangu/src/R/normalize-str.R


* https://techracho.bpsinc.jp/hachi8833/2020_10_07/95257
* https://tama-san.com/resolve-kanji/