1. Nauka
  2. /
  3. Kursy
  4. /
  5. Web Scraping w R

Connected

ćwiczenie

Sprawdź swojego user agenta

Normalnie podczas wysyłania żądań nie masz wglądu w nagłówki, które im towarzyszą.

Platforma testowa httpbin.org rozwiązuje ten problem: ma specjalny adres, który zwraca nagłówki każdego żądania, jakie do niej dotrze. Ten adres to: https://httpbin.org/headers.

Jeśli otworzysz ten URL w przeglądarce, otrzymasz dane JSON*, które zawierają nagłówki żądania przeglądarki. W polu User-Agent możesz zobaczyć coś w stylu Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:80.0) Gecko/20100101 Firefox/80.0 – w zależności od używanej przeglądarki i systemu operacyjnego. Wypróbuj to, a potem wróć do tego ćwiczenia!

*JavaScript Object Notation – popularny format wymiany danych

Instrukcje

100 XP
  • Sprawdź nagłówki zwracane przy dostępie do powyższego URL w R za pomocą metody GET().