Faites connaissance avec la fonction position()
Comme vous l’avez vu dans la vidéo, la fonction position() est très puissante lorsqu’elle est utilisée dans un prédicat. Combinée à des opérateurs, elle permet de sélectionner n’importe quel nœud parmi ceux qui correspondent à un certain chemin.
Vous allez l’utiliser avec l’extrait HTML ci-dessous, accessible via rules_html. Supposons qu’il s’agisse d’un site mis à jour en continu qui affiche certaines règles liées au Coronavirus pour un jour donné et pour le lendemain.
...
<div>
<h2>Today's rules</h2>
<p>Wear a mask</p>
<p>Wash your hands</p>
</div>
<div>
<h2>Tomorrow's rules</h2>
<p>Wear a mask</p>
<p>Wash your hands</p>
<small>Bring hand sanitizer with you</small>
</div>
...
Cet exercice fait partie du cours
Web scraping en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Select the text of the second p in every div
rules_html %>%
html_elements(xpath = ___) %>%
___