1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Web Scraping v R

Connected

cvičení

Přidání vlastního user agenta

Mimochodem, na httpbin.org existuje také adresa, která vrací pouze aktuálního user agenta (https://httpbin.org/user-agent). Právě tu využiješ v tomto cvičení, kde si upravíš vlastního user agenta tak, aby nesl smysluplnou informaci – tedy smysluplnou pro majitele webu, který scrapuješ.

Jak jsi viděl/a ve videu, při použití httr pro načítání webových zdrojů existují dva způsoby, jak user agenta přizpůsobit:

  1. Lokálně – jako argument aktuální metody požadavku.
  2. Globálně – pomocí set_config().

Pokyny 1/2

undefined XP
    1
    2
  • Pošli GET požadavek na https://httpbin.org/user-agent s vlastním user agentem s textem "A request from a DataCamp course on scraping" a výsledek vypiš.
  • V tomto kroku nastav user agenta lokálně.