auditR
!文節に区切る
MeCabでは形態素分析という、日本語を最小単位に分解する手順が用意されている。
今日 は よい お 天気 です 。
これはこれとして、日本語を分析するにあたっては、助詞との繋がりが重要な意味を持つ。
しかし、これをN-Gramなどで処理していたのでは、処理が重くなるから、最初から文節単位で区切ってしまいたい。
stringi::stri_opts_brkiter()
を使うとなんとかそれができるらしいことをTokyo.Rで知った。
Rを使って短歌の「詩的度」を測る あきる(paithiov909) 2024年2月24日
Last updated 2024-02-28 | auditR (c) N.Nawata