トップ 差分 一覧 ソース 検索 ヘルプ RSS ログイン 印刷

文節区切

auditR

!文節に区切る

MeCabでは形態素分析という、日本語を最小単位に分解する手順が用意されている。

今日 は よい お 天気 です 。

これはこれとして、日本語を分析するにあたっては、助詞との繋がりが重要な意味を持つ。

しかし、これをN-Gramなどで処理していたのでは、処理が重くなるから、最初から文節単位で区切ってしまいたい。

stringi::stri_opts_brkiter()

を使うとなんとかそれができるらしいことをTokyo.Rで知った。

Rを使って短歌の「詩的度」を測る あきる(paithiov909) 2024年2月24日


Last updated 2024-02-28 | auditR (c) N.Nawata