1. Learn
  2. /
  3. Courses
  4. /
  5. Web Scraping bằng R

Connected

Exercise

Thêm một user agent tùy chỉnh

Thực ra, httpbin.org còn có một địa chỉ chỉ trả về user agent hiện tại (https://httpbin.org/user-agent). Bạn sẽ dùng nó cho bài tập này, nơi bạn sẽ chỉnh sửa user agent của mình để biến nó thành thông tin có ý nghĩa (đối với chủ sở hữu website mà bạn đang scraping).

Như bạn đã thấy trong video, có hai cách để tùy chỉnh user agent khi dùng httr để lấy tài nguyên web:

  1. Cục bộ, tức là truyền như một đối số cho phương thức request hiện tại.
  2. Toàn cục thông qua set_config().

Instructions 1/2

undefined XP
    1
    2
  • Gửi một yêu cầu GET đến https://httpbin.org/user-agent với user agent tùy chỉnh ghi "A request from a DataCamp course on scraping" và in phản hồi ra.
  • Ở bước này, hãy đặt user agent ở phạm vi cục bộ.