Seleziona più tipi di HTML
Come hai visto nel video, i CSS possono essere usati per stilizzare una pagina web. Nella forma più basilare, ciò avviene tramite i selettori di tipo, in cui gli stili sono definiti e applicati a tutti gli elementi HTML di un certo tipo. Allo stesso modo, puoi usare i selettori di tipo per fare scraping di pagine alla ricerca di elementi HTML specifici.
Come mostrato nel video, puoi anche combinare più selettori di tipo con una virgola, cioè con html_elements("type1, type2"). Questo seleziona tutti gli elementi che hanno type1 oppure type2.
Guarda il seguente HTML:
<html>
<body>
<div>Python is perfect for programming.</div>
<p>Still, R might be better suited for data analysis.</p>
<small>(And has prettier charts, too.)</small>
</body>
</html>
Il codice HTML grezzo è fornito nella variabile languages_raw_html.
Questo esercizio fa parte del corso
Web scraping in R
Istruzioni dell'esercizio
- Leggi
languages_raw_html. - Usando il metodo mostrato sopra, seleziona tutti gli elementi
divepin questo HTML.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Read in the HTML
languages_html <- ___
# Select the div and p tags and print their text
languages_html %>%
___ %>%
html_text()