- 追加された行はこのように表示されます。
- 削除された行は
このように表示されます。
!文字列処理
Rで文字列を直接処理することはあまりないが、検索したり特定の「単語」(取引先名称、隠語など)が入っているフィールドを抜き出すなどの時には必要なテクニック。
例えば、仕訳データの「摘要欄」を活用した監査手続に使える。
{{category stringr}}パッケージを使う。
:参考:stringrの解説はこのお二方の頁をいつも参照している。
* [stringr — Rの文字列をまともな方法で処理する |https://heavywatal.github.io/rstats/stringr.html]
* [stringrを使って文字列処理をやってみる|https://kazutan.github.io/kazutanR/stringr-intro.html]
!よくやる誤り
stringrが扱うオブジェクトは、文字列ないし文字列のベクトルなので、パイプ演算子を使ってselect(項目名)を渡しても失敗する。
なぜなら、selectで選ばれる項目はあくまでもデータフレームだから。
項目をベクトルとして渡したければ、
df %>% select(項目名) %>% str_xxx("pattern",...) 失敗例
df %>% .$項目名 %>% str_xxx("pattern", ...) これならOK
データフレームの特定の列からベクトルを取り出すには、pull()という関数もある。
df %>% dplyr::pull(項目名) %>% str_xxx("pattern", ..)
!その他
コマンド:grep(“検索したい語”,オブジェクト)
返される値:TrueとなるIDのベクトル