1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Importing Data in Python

Connected

cvičení

Převod webové stránky na data pomocí BeautifulSoup: získávání hypertextových odkazů

V tomto cvičení zjistíš, jak z webové stránky BDFLa extrahovat URL adresy hypertextových odkazů. Při tom se dobře skamarádíš s metodou find_all() z knihovny BeautifulSoup.

Pokyny

100 XP
  • Pomocí metody find_all() najdi všechny hypertextové odkazy v objektu soup — pamatuj, že hypertextové odkazy jsou definovány HTML tagem <a>, který se ale do find_all() předává bez ostrých závorek. Výsledek ulož do proměnné a_tags.
  • Proměnná a_tags je množina výsledků: tvým úkolem je projít ji pomocí for smyčky a vypsat skutečné URL adresy odkazů. Pro každý prvek link v a_tags zavolej print() s argumentem link.get('href').