Houston, kita mendapat 404!
Seperti yang Anda lihat di video, bagian mendasar dari sistem HTTP adalah kode status: Kode ini memberi tahu apakah semuanya baik-baik saja atau ada masalah dengan permintaan Anda.
Merupakan praktik yang baik untuk selalu memeriksa kode status dari sebuah respons sebelum mulai bekerja dengan halaman yang diunduh. Untuk itu, Anda dapat menggunakan fungsi status_code() dari paket httr(). Fungsi ini menerima argumen berupa objek respons yang dihasilkan oleh metode permintaan.
Sekarang, anggaplah Anda mencoba melakukan scraping pada halaman yang sama seperti sebelumnya, tetapi entah bagaimana Anda salah menuliskan URL (Varigott alih-alih Varigotti).
Latihan ini adalah bagian dari kursus
Web Scraping di R
Petunjuk latihan
- Baca kode status dari objek respons hasil permintaan GET.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
response <- GET('https://en.wikipedia.org/wiki/Varigott')
# Print status code of inexistent page
___