Texte de tous les niveaux
Cet exercice est similaire au précédent, mais diffère en ce sens que vous allez sélectionner du texte à partir de plusieurs générations d'un élément donné.
Vous écrirez un XPath et CSS Locator strings pour diriger vers le texte d'un paragraphe spécifique p
element. L'élément p
du site HTML est défini de manière unique par son attribut id
, qui est "p3"
. Avec ces quelques informations, vous devriez être en mesure de créer les chaînes souhaitées ; cependant, nous avons préchargé la variable html
avec une chaîne contenant le site HTML auquel appartient ce lien, si vous souhaitez le consulter.
Dans cet exercice, vous ne sélectionnerez que le texte à l'intérieur de l'élément, ce qui inclut tout le texte à l'intérieur des générations futures. Nous avons créé une fonction print_results
pour vous permettre de comparer les éléments auxquels vos chaînes de caractères se rapportent.
Cet exercice fait partie du cours
Web Scraping en Python
Instructions
- Attribuez à la variable
xpath
une chaîne de caractères XPdirigée vers le texte de l'élément du paragraphep
avecid
égal àp3
, qui comprend le texte des générations futures de cet élémentp
. - Affectez à la variable
css_locator
une chaîne CSS Locator renvoyant à ce même texte.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create an XPath string to the desired text.
xpath = ____
# Create a CSS Locator string to the desired text.
css_locator = ____
# Print the text from our selections
print_results( xpath, css_locator )