Houston, on a un code 404 !
Comme vous l’avez vu dans la vidéo, un élément essentiel du système HTTP est constitué par les codes d’état : ils indiquent si tout s’est bien passé ou s’il y a un problème avec votre requête.
Il est recommandé de toujours vérifier le code d’état d’une réponse avant de commencer à travailler avec la page téléchargée. Pour cela, vous pouvez utiliser la fonction status_code() du package httr(). Elle prend en argument un objet de réponse issu d’une méthode de requête.
Supposons maintenant que vous essayiez d’extraire la même page qu’auparavant, mais que vous vous soyez trompé d’URL (Varigott au lieu de Varigotti).
Cet exercice fait partie du cours
Web scraping en R
Instructions
- Lisez le code d’état de l’objet réponse obtenu par la requête GET.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
response <- GET('https://en.wikipedia.org/wiki/Varigott')
# Print status code of inexistent page
___