1. Învăţa
  2. /
  3. Courses
  4. /
  5. Rで学ぶWebスクレイピング

Connected

exercise

html_table() で表をデータフレームに変換する

表にヘッダー行(th 要素)があり、欠損がなければ、次の表(ID は "clean")のようにスクレイピングは簡単です。

Mountain Height First ascent Country
Mount Everest 8848 1953 Nepal, China
...

同じ表でも(ID は "dirty")、ヘッダー行が明示されておらず、最初の行に欠損セルがある場合は次のようになります。

Mountain Height First ascent Country
Mount Everest 8848 1953
...

このような場合、動画で示したとおり、html_table() には表を正しくパースするための追加引数があります。欠損セルは自動的に検出され、NA に置き換えられます。

どちらの表も mountains_html ドキュメント内に含まれています。

Instrucțiuni 1 / 2

undefined XP
  • 1

    ID が "clean" の table を、mountains というデータフレームに変換してください。

  • 2
    • 同様に ID が "dirty" の table でも行い、先頭行をヘッダーとして指定してください。