Alle niveaus-tekst
Deze oefening lijkt op de vorige, maar verschilt doordat je tekst selecteert uit meerdere generaties van een gegeven element.
Je schrijft XPath- en CSS Locator-strings die verwijzen naar de tekst van een specifieke paragraaf, het p-element. Het p-element in de HTML is uniek gedefinieerd door zijn id-attribuut, namelijk "p3". Met deze kleine hoeveelheid informatie zou je de gewenste strings moeten kunnen maken; we hebben echter de variabele html al gevuld met een string met de HTML waarin deze link voorkomt, als je die wilt bekijken.
In deze oefening selecteer je alleen de tekst binnen het element die inclusief alle tekst van toekomstige generaties is. We hebben een functie print_results voor je gemaakt om te vergelijken naar welke elementen jouw strings verwijzen.
Deze oefening maakt deel uit van de cursus
Webscraping in Python
Oefeninstructies
- Ken aan de variabele
xpatheen XPath-string toe die verwijst naar de tekst binnen het paragraaf-p-element metidgelijk aanp3, die inclusief de tekst van toekomstige generaties van ditp-element is. - Ken aan de variabele
css_locatoreen CSS Locator-string toe die naar dezelfde tekst verwijst.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create an XPath string to the desired text.
xpath = ____
# Create a CSS Locator string to the desired text.
css_locator = ____
# Print the text from our selections
print_results( xpath, css_locator )