トップ 差分 一覧 ソース 検索 ヘルプ RSS ログイン 印刷

文字列処理

auditR

文字列処理

Rで文字列を直接処理することはあまりないが、検索したり特定の「単語」(取引先名称、隠語など)が入っているフィールドを抜き出すなどの時には必要なテクニック。

例えば、仕訳データの「摘要欄」を活用した監査手続に使える。

[stringr]パッケージを使う。

参考
stringrの解説はこのお二方の頁をいつも参照している。

よくやる誤り

stringrが扱うオブジェクトは、文字列ないし文字列のベクトルなので、パイプ演算子を使ってselect(項目名)を渡しても失敗する。なぜなら、selectで選ばれる項目はあくまでもデータフレームだから。項目をベクトルとして渡したければ、

df %>% select(項目名) %>% str_xxx("pattern",...)   失敗例
df %>% .$項目名 %>% str_xxx("pattern", ...)  これならOK

データフレームの特定の列からベクトルを取り出すには、pull()という関数もある。

df %>% dplyr::pull(項目名) %>% str_xxx("pattern", ..)

その他

コマンド:grep(“検索したい語”,オブジェクト)返される値:TrueとなるIDのベクトル


Last updated 2015-05-21 | auditR (c) N.Nawata