1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Web Scraping v R

Connected

cvičení

Výběr více HTML typů

Jak jsi viděl/a ve videu, CSS slouží ke stylování webových stránek. V základní podobě se to děje pomocí typových selektorů, které definují styly pro všechny HTML elementy daného typu a zároveň na ně tyto styly aplikují. Typové selektory ale můžeš využít i při scrapování – k výběru konkrétních HTML elementů ze stránky.

Jak bylo ukázáno ve videu, více typových selektorů lze kombinovat pomocí čárky, tedy zápisem html_elements("type1, type2"). Tím vyberéš všechny elementy, které mají typ type1 nebo type2.

Podívej se na následující HTML:

<html> 
  <body> 
    <div>Python is perfect for programming.</div>
    <p>Still, R might be better suited for data analysis.</p>
    <small>(And has prettier charts, too.)</small>
  </body> 
</html>

Syrový HTML kód máš k dispozici v proměnné languages_raw_html.

Pokyny

100 XP
  • Načti languages_raw_html.
  • Pomocí výše popsané metody vyber všechny elementy div a p v tomto HTML.