LoslegenKostenlos loslegen

Wandle eine Tabelle mit html_table() in ein Data Frame um

Wenn eine Tabelle eine Kopfzeile (mit th-Elementen) und keine Lücken hat, ist das Scrapen unkompliziert – wie bei der folgenden Tabelle (mit der ID "clean"):

Mountain Height First ascent Country
Mount Everest 8848 1953 Nepal, China
...

Hier ist dieselbe Tabelle (mit der ID "dirty") ohne ausgewiesene Kopfzeile und mit einer fehlenden Zelle in der ersten Zeile:

Mountain Height First ascent Country
Mount Everest 8848 1953
...

Für solche Fälle hat html_table() ein zusätzliches Argument, mit dem du die Tabelle korrekt parsen kannst, wie im Video gezeigt. Fehlende Zellen werden automatisch erkannt und durch NA-Werte ersetzt.

Beide Tabellen befinden sich im Dokument mountains_html.

Diese Übung ist Teil des Kurses

Web Scraping in R

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Extract the "clean" table into a data frame 
mountains <- mountains_html %>% 
  html_element("table#clean") %>% 
  ___

mountains
Code bearbeiten und ausführen