IniziaInizia gratis

Seleziona più tipi di HTML

Come hai visto nel video, i CSS possono essere usati per stilizzare una pagina web. Nella forma più basilare, ciò avviene tramite i selettori di tipo, in cui gli stili sono definiti e applicati a tutti gli elementi HTML di un certo tipo. Allo stesso modo, puoi usare i selettori di tipo per fare scraping di pagine alla ricerca di elementi HTML specifici.

Come mostrato nel video, puoi anche combinare più selettori di tipo con una virgola, cioè con html_elements("type1, type2"). Questo seleziona tutti gli elementi che hanno type1 oppure type2.

Guarda il seguente HTML:

<html> 
  <body> 
    <div>Python is perfect for programming.</div>
    <p>Still, R might be better suited for data analysis.</p>
    <small>(And has prettier charts, too.)</small>
  </body> 
</html>

Il codice HTML grezzo è fornito nella variabile languages_raw_html.

Questo esercizio fa parte del corso

Web scraping in R

Visualizza il corso

Istruzioni dell'esercizio

  • Leggi languages_raw_html.
  • Usando il metodo mostrato sopra, seleziona tutti gli elementi div e p in questo HTML.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Read in the HTML
languages_html <- ___
# Select the div and p tags and print their text
languages_html %>%
	___ %>%
	html_text()
Modifica ed esegui il codice