LoslegenKostenlos loslegen

Houston, wir haben eine 404!

Wie du im Video gesehen hast, sind Statuscodes ein grundlegender Teil des HTTP-Systems: Sie sagen dir, ob alles in Ordnung ist oder ob es ein Problem mit deiner Anfrage gibt.

Es ist gute Praxis, den Statuscode einer Response immer zu prüfen, bevor du mit der heruntergeladenen Seite weiterarbeitest. Dafür kannst du die Funktion status_code() aus dem Paket httr() verwenden. Sie nimmt als Argument ein Response-Objekt, das aus einer Request-Methode stammt.

Nehmen wir nun an, du versuchst, dieselbe Seite wie zuvor zu scrapen, aber irgendwie ist dir die URL verrutscht (Varigott statt Varigotti).

Diese Übung ist Teil des Kurses

Web Scraping in R

Kurs anzeigen

Anleitung zur Übung

  • Lies den Statuscode des Response-Objekts aus der GET-Anfrage aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

response <- GET('https://en.wikipedia.org/wiki/Varigott')
# Print status code of inexistent page
___
Code bearbeiten und ausführen