トップ 一覧 検索 ヘルプ RSS ログイン 印刷

xpathの変更点

  • 追加された行はこのように表示されます。
  • 削除された行はこのように表示されます。
{{category package}} {{category rvest}}

!rvestを使ってXBRLファイルを扱う際のXpath指定

XBRLファイルを扱うには、特定のノードの要素名を知っていればその要素名で

 xmlobj %>% rvest:html_node(xpath = "//nodename")

とすれば目的のノードにたどり着ける。しかしノードが曖昧であったり、同じ意味の複数のノードが番号で分けられたりすると、検索したくなる。

そこで例えばノードの要素名に'''hogehoge'を含むものを検索したいとき、

 xmlobj %>% rvest:html_nodes(xpath = "//*[contains(name(), 'hogehoge']")

とする。

:ハマった誤り:これで半日を費やした(´・ω・`)
* 'hogehoge'のクオートはシングルクオートにしないとxpathのダブルクオートとぶつかる
* パラメタ指定に、'''xpath='''を忘れないように。CSSセレクタがデフォルトになっているらしい。