トップ 一覧 検索 ヘルプ RSS ログイン 印刷

文字列処理の変更点

  • 追加された行はこのように表示されます。
  • 削除された行はこのように表示されます。
!文字列処理

Rで文字列を直接処理することはあまりないが、検索したり特定の「単語」(取引先名称、隠語など)が入っているフィールドを抜き出すなどの時には必要なテクニック。

例えば、仕訳データの「摘要欄」を活用した監査手続に使える。

{{category stringr}}パッケージを使う。

:参考:stringrの解説はこのお二方の頁をいつも参照している。

* [stringr — Rの文字列をまともな方法で処理する |https://heavywatal.github.io/rstats/stringr.html]
* [stringrを使って文字列処理をやってみる|https://kazutan.github.io/kazutanR/stringr-intro.html]

!よくやる誤り
stringrが扱うオブジェクトは、文字列ないし文字列のベクトルなので、パイプ演算子を使ってselect(項目名)を渡しても失敗する。
なぜなら、selectで選ばれる項目はあくまでもデータフレームだから。
項目をベクトルとして渡したければ、

 df %>% select(項目名) %>% str_xxx("pattern",...)   失敗例
 df %>% .$項目名 %>% str_xxx("pattern", ...)  これならOK

データフレームの特定の列からベクトルを取り出すには、pull()という関数もある。

 df %>% dplyr::pull(項目名) %>% str_xxx("pattern", ..)

!その他
コマンド:grep(“検索したい語”,オブジェクト)
返される値:TrueとなるIDのベクトル