1. Apprendre
  2. /
  3. Cours
  4. /
  5. Importation intermédiaire de données en Python

Connected

Exercice

Transformer une page Web en données avec BeautifulSoup : récupérer les hyperliens

Dans cet exercice, vous allez apprendre à extraire les URL des hyperliens à partir de la page Web du BDFL. Au passage, vous deviendrez très à l'aise avec la méthode de la soupe find_all().

Instructions

100 XP
  • Utilisez la méthode find_all() pour trouver tous les hyperliens dans soup, en vous rappelant que les hyperliens sont définis par l'étiquette HTML <a> mais sont passés à find_all() sans chevrons; stockez le résultat dans la variable a_tags.
  • La variable a_tags est un ensemble de résultats : votre tâche maintenant est de l'énumérer à l'aide d'une boucle for et d'imprimer les URL réelles des hyperliens; pour ce faire, pour chaque élément link dans a_tags, vous devez print() link.get('href').