CommencerCommencer gratuitement

Révéler par la réponse

Nous avons préchargé un objet Response, nommé response, avec le contenu d'un site web secret. Votre tâche consiste à déterminer le site URL et le titre du site web à l'aide de la variable réponse. Vous avez appris à trouver le site URL dans la dernière leçon. Pour trouver le titre du site web, vous devez savoir ce qui suit :

  • Le titre est le texte de l'élément title.
  • L'élément title est un enfant de l'élément head, qui est un enfant de l'élément racine html.

À noter : l'élément racine html n'a qu'un seul élément enfant head, et l'élément head n'a qu'un seul élément enfant title.

Cet exercice fait partie du cours

Web Scraping en Python

Afficher le cours

Instructions

  • Attribuer à la variable this_url le URL utilisé pour charger la variable response.
  • Attribuez à la variable this_title le titre du site web utilisé pour charger la variable response. Comme nous ne voulons que le texte de l'élément unique que nous allons sélectionner, nous utilisons la méthode extract_first() pour extraire le texte.
  • Que vous utilisiez xpath ou css, assurez-vous que vous sélectionnez le texte à l'intérieur de l'élément de titre, et pas seulement le titre lui-même.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Get the URL to the website loaded in response
this_url = ____

# Get the title of the website loaded in response
this_title = response.____.extract_first()

# Print out our findings
print_url_title( this_url, this_title )
Modifier et exécuter le code