1. Apprendre
  2. /
  3. Cours
  4. /
  5. Importation intermédiaire de données en Python

Connected

Exercice

Transformer une page Web en données avec BeautifulSoup : extraire le texte

Comme promis, dans les prochains exercices, vous allez apprendre les bases de l'extraction d'information à partir d'une soupe HTML. Dans cet exercice, vous verrez comment extraire le texte de la page Web du BDFL et afficher le titre de la page.

Instructions

100 XP
  • Dans l'exemple de code, l'objet de réponse HTML html_doc a déjà été créé : votre première tâche est de le convertir en « soupe » avec la fonction BeautifulSoup() et d'assigner la soupe résultante à la variable soup.
  • Extrayez le titre de la soupe HTML soup à l'aide de l'attribut title et assignez le résultat à guido_title.
  • Affichez le titre de la page Web de Guido dans le terminal à l'aide de la fonction print().
  • Extrayez le texte de la soupe HTML soup à l'aide de la méthode get_text() et assignez-le à guido_text.
  • Cliquez sur Soumettre la réponse pour afficher le texte de la page Web de Guido dans le terminal.