Sélectionner les descendants directs avec le combinateur enfant
À ce stade, vous savez sûrement sélectionner des éléments par type, classe ou ID. Cependant, il existe des cas où ces sélecteurs ne suffisent pas, par exemple si vous souhaitez n’extraire que les descendants directs de l’élément ul supérieur. Pour cela, vous utiliserez le combinateur enfant (>) présenté dans la vidéo.
Ici, votre objectif est d’extraire une liste (contenue dans le document languages_html) de tous les langages informatiques mentionnés, mais sans les informations associées dans les sous-puces :
<ul id = 'languages'>
<li>SQL</li>
<ul>
<li>Bases de données</li>
<li>Langage de requête</li>
</ul>
<li>R</li>
<ul>
<li>Collecte</li>
<li>Analyse</li>
<li>Visualisation</li>
</ul>
<li>Python</li>
</ul>
Cet exercice fait partie du cours
Web scraping en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Extract the text of all list elements
languages_html %>%
___ %>%
___