1. Learn
  2. /
  3. Cursuri
  4. /
  5. Importul intermediar de date în Python

Connected

exercițiu

Transformarea unei pagini web în date cu BeautifulSoup: extragerea hyperlink-urilor

În acest exercițiu, vei descoperi cum să extragi URL-urile hyperlink-urilor de pe pagina web a BDFL. Pe parcurs, vei deveni un bun cunoscător al metodei find_all() din BeautifulSoup.

Instrucțiuni

100 XP
  • Folosește metoda find_all() pentru a găsi toate hyperlink-urile din soup, ținând cont că hyperlink-urile sunt definite de tag-ul HTML <a>, dar se transmit către find_all() fără paranteze unghiulare; stochează rezultatul în variabila a_tags.
  • Variabila a_tags este un set de rezultate: sarcina ta acum este să o parcurgi cu o buclă for și să afișezi URL-urile efective ale hyperlink-urilor; pentru asta, pentru fiecare element link din a_tags, apelează print() cu link.get('href').