Houston, abbiamo un 404!
Come hai visto nel video, una parte fondamentale del sistema HTTP sono i codici di stato: indicano se è tutto a posto oppure se c’è un problema con la tua richiesta.
È buona norma controllare sempre il codice di stato di una risposta prima di iniziare a lavorare con la pagina scaricata. Per farlo, puoi usare la funzione status_code() del pacchetto httr(). Prende come argomento un oggetto response risultante da un metodo di richiesta.
Ora immaginiamo che tu stia cercando di fare scraping della stessa pagina di prima, ma in qualche modo hai sbagliato URL (Varigott invece di Varigotti).
Questo esercizio fa parte del corso
Web scraping in R
Istruzioni dell'esercizio
- Leggi il codice di stato dell'oggetto response ottenuto dalla richiesta GET.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
response <- GET('https://en.wikipedia.org/wiki/Varigott')
# Print status code of inexistent page
___