!文字列処理 Rで文字列を直接処理することはあまりないが、検索したり特定の「単語」(取引先名称、隠語など)が入っているフィールドを抜き出すなどの時には必要なテクニック。 例えば、仕訳データの「摘要欄」を活用した監査手続に使える。 {{category stringr}}パッケージを使う。 :参考:stringrの解説はこのお二方の頁をいつも参照している。 * [stringr — Rの文字列をまともな方法で処理する |https://heavywatal.github.io/rstats/stringr.html] * [stringrを使って文字列処理をやってみる|https://kazutan.github.io/kazutanR/stringr-intro.html] !よくやる誤り stringrが扱うオブジェクトは、文字列ないし文字列のベクトルなので、パイプ演算子を使ってselect(項目名)を渡しても失敗する。 なぜなら、selectで選ばれる項目はあくまでもデータフレームだから。 項目をベクトルとして渡したければ、 df %>% select(項目名) %>% str_xxx("pattern",...) 失敗例 df %>% .$項目名 %>% str_xxx("pattern", ...) これならOK データフレームの特定の列からベクトルを取り出すには、pull()という関数もある。 df %>% dplyr::pull(項目名) %>% str_xxx("pattern", ..) !その他 コマンド:grep(“検索したい語”,オブジェクト) 返される値:TrueとなるIDのベクトル