1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Web Scraping v R

Connected

cvičení

Výběr přímých potomků pomocí child kombinátoru

Teď už jistě víš, jak vybírat elementy podle typu, třídy nebo ID. Existují ale situace, kdy tyto selektory nestačí – například pokud chceš extrahovat jen přímé potomky nejvyššího elementu ul. K tomu slouží child kombinátor (>), který byl představen ve videu.

Tvým cílem je ze stránky (uložené v dokumentu languages_html) získat seznam všech zmíněných programovacích jazyků, ale bez doprovodných informací v pododrážkách:

  <ul id = 'languages'>
    <li>SQL</li>
    <ul>    
      <li>Databases</li>
      <li>Query Language</li>
    </ul>
    <li>R</li>
    <ul>
      <li>Collection</li>
      <li>Analysis</li>
      <li>Visualization</li>
    </ul>
    <li>Python</li>
  </ul>

Instrukce 1/2

undefined XP
  • 1

    Nejprve získej všechny elementy li ve vnořeném seznamu zobrazeném výše a vypiš jejich text.

  • 2

    Na rozdíl od předchozího kroku zkus extrahovat pouze přímé potomky nejvyššího elementu ul pomocí child kombinátoru.