Révéler par la réponse
Nous avons préchargé un objet Response
, nommé response
, avec le contenu d'un site web secret. Votre tâche consiste à déterminer le site URL et le titre du site web à l'aide de la variable réponse. Vous avez appris à trouver le site URL dans la dernière leçon. Pour trouver le titre du site web, vous devez savoir ce qui suit :
- Le titre est le texte de l'élément
title
. - L'élément
title
est un enfant de l'élémenthead
, qui est un enfant de l'élément racinehtml
.
À noter : l'élément racine html
n'a qu'un seul élément enfant head
, et l'élément head
n'a qu'un seul élément enfant title
.
Cet exercice fait partie du cours
Web Scraping en Python
Instructions
- Attribuer à la variable
this_url
le URL utilisé pour charger la variableresponse
. - Attribuez à la variable
this_title
le titre du site web utilisé pour charger la variableresponse
. Comme nous ne voulons que le texte de l'élément unique que nous allons sélectionner, nous utilisons la méthodeextract_first()
pour extraire le texte. - Que vous utilisiez
xpath
oucss
, assurez-vous que vous sélectionnez le texte à l'intérieur de l'élément de titre, et pas seulement le titre lui-même.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Get the URL to the website loaded in response
this_url = ____
# Get the title of the website loaded in response
this_title = response.____.extract_first()
# Print out our findings
print_url_title( this_url, this_title )