Selecionar vários tipos de HTML
Como você viu no vídeo, CSS pode ser usado para estilizar uma página da web. Na forma mais básica, isso acontece por meio de seletores de tipo, em que estilos são definidos e aplicados a todos os elementos HTML de um certo tipo. Por sua vez, você também pode usar seletores de tipo para coletar páginas em busca de elementos HTML específicos.
Como mostrado no vídeo, você também pode combinar vários seletores de tipo com uma vírgula, ou seja, com html_elements("type1, type2"). Isso seleciona todos os elementos que têm type1 ou type2.
Dê uma olhada no HTML a seguir:
<html>
<body>
<div>Python is perfect for programming.</div>
<p>Still, R might be better suited for data analysis.</p>
<small>(And has prettier charts, too.)</small>
</body>
</html>
O código HTML bruto é fornecido para você na variável languages_raw_html.
Este exercício faz parte do curso
Web Scraping em R
Instruções do exercício
- Leia
languages_raw_html. - Usando o método mostrado acima, selecione todos os elementos
divepneste HTML.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Read in the HTML
languages_html <- ___
# Select the div and p tags and print their text
languages_html %>%
___ %>%
html_text()