HTTP? httr! (1)
Eine Datei aus dem Internet herunterzuladen bedeutet, eine GET-Anfrage zu senden und die angeforderte Datei zu erhalten. Intern verwenden alle zuvor besprochenen Funktionen eine GET-Anfrage, um Dateien herunterzuladen.
httr stellt mit GET() eine praktische Funktion bereit, um diese GET-Anfrage auszuführen. Das Ergebnis ist ein response-Objekt, das einfachen Zugriff auf den Statuscode, den Content-Type und natürlich den eigentlichen Inhalt bietet.
Du kannst den Inhalt der Anfrage mit der Funktion content() extrahieren. Zum Zeitpunkt der Erstellung gibt es drei Möglichkeiten, diesen Inhalt abzurufen: als Raw-Objekt, als Character-Vektor oder als R-Objekt, beispielsweise eine Liste. Wenn du content() über das Argument as nicht mitteilst, wie der Inhalt abgerufen werden soll, versucht die Funktion anhand des Content-Types den am besten passenden Typ zu bestimmen.
Diese Übung ist Teil des Kurses
Fortgeschrittenes Importieren von Daten in R
Anleitung zur Übung
- Lade das Paket
httr. Es ist auf den Servern von DataCamp bereits installiert. - Verwende
GET(), um die inurlgespeicherte URL abzurufen. Speichere das Ergebnis diesesGET()-Aufrufs alsresp. - Gib das Objekt
respaus. Welche Informationen enthält es? - Hole den Inhalt von
respmitcontent()und setze das Argumentasauf"raw". Weise den resultierenden Vektorraw_contentzu. - Gib die ersten Werte in
raw_contentmithead()aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load the httr package
# Get the url, save response to resp
url <- "http://www.example.com/"
# Print resp
# Get the raw content of resp: raw_content
# Print the head of raw_content