parse_number()

(カンマ付きなど)文字列になっている金額を数値型に変換する

有価証券報告書などの記述情報の中にある金額情報は文字列であり、そのまま扱うだけなら支障はないが、寄せ集めて演算・集計などに用いる時は不便である。

そこで、1,234百万円や、△2,345などの文字列を、単純な数値(この場合、単位は削ぎ落とされる)に置き換えることが出来る。

なお、いまのところ日本でよく使われる負の数を表す△についてはに変換してくれないので、str_replace(x, "△", "-")で変換した後に、parse_numberすればよい。

なお、パターンの部分は正規表現が使えるため、たとえば、▲と△が混在しているようなケースでは、"▲|△"とする。

#数字に置き換える実験
dummynum = c("1,234",  "△2,345",  "ー",  "△4,567百万円") %>% print
[1] "1,234"         "△2,345"       "ー"            "△4,567百万円"
dummynum %>% str_replace("△","-") %>% parse_number(na = c("","ー","−"))
[1]  1234 -2345    NA -4567

百万円などの単位を取り除くだけなら、stringr::str_replace(x, "hoge", "")については、stringr::str_remove(x, "hoge")も可能。

参考: