トップ 差分 一覧 ソース 検索 ヘルプ RSS ログイン 印刷

html_table()

auditR

[package] [rvest]

HTMLファイルから表(tableタグ)を読み取ってデータフレームにする

xmlfile.xhtmlが仮にあったとして、その中からtableを読み取って何かのデータを得たいとき。

xml2::xml_read("xmlfile.xhtml") %>%
rvest::html_text %>%
rvest::html_table -> dataframe.df

但し、いくつかの前提となる制約がある。

  1. テーブルは列や行が統合されていない(統合されていれば同じ要素をその数だけ加える)
  2. 見出しの行は一番上にある

さらに、もともとのテーブルがデータ処理用に縦横綺麗に作られているとは限りません。実は個々の処理が一番苦労する。


Last updated 2019-08-02 | auditR (c) N.Nawata