LoslegenKostenlos loslegen

HTTP? httr! (1)

Eine Datei aus dem Internet herunterzuladen bedeutet, eine GET-Anfrage zu senden und die angeforderte Datei zu erhalten. Intern verwenden alle zuvor besprochenen Funktionen eine GET-Anfrage, um Dateien herunterzuladen.

httr stellt mit GET() eine praktische Funktion bereit, um diese GET-Anfrage auszuführen. Das Ergebnis ist ein response-Objekt, das einfachen Zugriff auf den Statuscode, den Content-Type und natürlich den eigentlichen Inhalt bietet.

Du kannst den Inhalt der Anfrage mit der Funktion content() extrahieren. Zum Zeitpunkt der Erstellung gibt es drei Möglichkeiten, diesen Inhalt abzurufen: als Raw-Objekt, als Character-Vektor oder als R-Objekt, beispielsweise eine Liste. Wenn du content() über das Argument as nicht mitteilst, wie der Inhalt abgerufen werden soll, versucht die Funktion anhand des Content-Types den am besten passenden Typ zu bestimmen.

Diese Übung ist Teil des Kurses

Fortgeschrittenes Importieren von Daten in R

Kurs anzeigen

Anleitung zur Übung

  • Lade das Paket httr. Es ist auf den Servern von DataCamp bereits installiert.
  • Verwende GET(), um die in url gespeicherte URL abzurufen. Speichere das Ergebnis dieses GET()-Aufrufs als resp.
  • Gib das Objekt resp aus. Welche Informationen enthält es?
  • Hole den Inhalt von resp mit content() und setze das Argument as auf "raw". Weise den resultierenden Vektor raw_content zu.
  • Gib die ersten Werte in raw_content mit head() aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load the httr package


# Get the url, save response to resp
url <- "http://www.example.com/"


# Print resp


# Get the raw content of resp: raw_content


# Print the head of raw_content
Code bearbeiten und ausführen