Seleziona i discendenti diretti con il combinatore child
A questo punto sai già selezionare gli elementi per tipo, classe o ID. Tuttavia, ci sono casi in cui questi selettori non bastano, ad esempio se vuoi estrarre solo i discendenti diretti dell’elemento ul superiore. Per questo userai il combinatore child (>) presentato nel video.
Qui, il tuo obiettivo è fare scraping di un elenco (contenuto nel documento languages_html) di tutti i linguaggi di programmazione menzionati, ma senza le informazioni aggiuntive nei sottoelenchi:
<ul id = 'languages'>
<li>SQL</li>
<ul>
<li>Databases</li>
<li>Query Language</li>
</ul>
<li>R</li>
<ul>
<li>Collection</li>
<li>Analysis</li>
<li>Visualization</li>
</ul>
<li>Python</li>
</ul>
Questo esercizio fa parte del corso
Web scraping in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Extract the text of all list elements
languages_html %>%
___ %>%
___