IniziaInizia gratis

Seleziona i discendenti diretti con il combinatore child

A questo punto sai già selezionare gli elementi per tipo, classe o ID. Tuttavia, ci sono casi in cui questi selettori non bastano, ad esempio se vuoi estrarre solo i discendenti diretti dell’elemento ul superiore. Per questo userai il combinatore child (>) presentato nel video.

Qui, il tuo obiettivo è fare scraping di un elenco (contenuto nel documento languages_html) di tutti i linguaggi di programmazione menzionati, ma senza le informazioni aggiuntive nei sottoelenchi:

  <ul id = 'languages'>
    <li>SQL</li>
    <ul>    
      <li>Databases</li>
      <li>Query Language</li>
    </ul>
    <li>R</li>
    <ul>
      <li>Collection</li>
      <li>Analysis</li>
      <li>Visualization</li>
    </ul>
    <li>Python</li>
  </ul>

Questo esercizio fa parte del corso

Web scraping in R

Visualizza il corso

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Extract the text of all list elements
languages_html %>% 
	___ %>% 
	___
Modifica ed esegui il codice