CommencerCommencer gratuitement

Faites connaissance avec la fonction position()

Comme vous l’avez vu dans la vidéo, la fonction position() est très puissante lorsqu’elle est utilisée dans un prédicat. Combinée à des opérateurs, elle permet de sélectionner n’importe quel nœud parmi ceux qui correspondent à un certain chemin.

Vous allez l’utiliser avec l’extrait HTML ci-dessous, accessible via rules_html. Supposons qu’il s’agisse d’un site mis à jour en continu qui affiche certaines règles liées au Coronavirus pour un jour donné et pour le lendemain.

...
<div>
  <h2>Today's rules</h2>
  <p>Wear a mask</p>
  <p>Wash your hands</p>
</div>
<div>
  <h2>Tomorrow's rules</h2>
  <p>Wear a mask</p>
  <p>Wash your hands</p>
  <small>Bring hand sanitizer with you</small>
</div>
...

Cet exercice fait partie du cours

Web scraping en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Select the text of the second p in every div
rules_html %>% 
  html_elements(xpath = ___) %>%
  ___
Modifier et exécuter le code