1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Web Scraping bằng R

Connected

Bài tập

Houston, chúng ta nhận 404 rồi!

Như bạn đã thấy trong video, một phần cốt lõi của hệ thống HTTP là các mã trạng thái (status code): chúng cho bạn biết mọi thứ đều ổn hay có vấn đề với yêu cầu của bạn.

Thực hành tốt là luôn kiểm tra mã trạng thái của phản hồi trước khi bạn bắt đầu làm việc với trang đã tải về. Để làm điều này, bạn có thể dùng hàm status_code() từ gói httr(). Hàm này nhận đối tượng phản hồi (response) được tạo ra từ một phương thức yêu cầu.

Bây giờ giả sử bạn đang cố scrape cùng một trang như trước, nhưng bằng cách nào đó bạn đã nhập sai URL (Varigott thay vì Varigotti).

Hướng dẫn

100 XP
  • Đọc mã trạng thái của đối tượng phản hồi từ yêu cầu GET.