Aan de slagGa gratis aan de slag

Houston, we got a 404!

Zoals je in de video hebt gezien, zijn statuscodes een fundamenteel onderdeel van het HTTP-systeem: ze vertellen je of alles in orde is of dat er een probleem is met je verzoek.

Het is goede gewoonte om altijd eerst de statuscode van een response te controleren voordat je met de gedownloade pagina aan de slag gaat. Gebruik hiervoor de functie status_code() uit het pakket httr(). Die neemt als argument een response-object dat het resultaat is van een request-methode.

Stel nu dat je probeert dezelfde pagina als eerder te scrapen, maar dat de URL per ongeluk verkeerd is (Varigott in plaats van Varigotti).

Deze oefening maakt deel uit van de cursus

Webscraping in R

Cursus bekijken

Oefeninstructies

  • Lees de statuscode uit van het response-object van het GET-verzoek.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

response <- GET('https://en.wikipedia.org/wiki/Varigott')
# Print status code of inexistent page
___
Code bewerken en uitvoeren