1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Web Scraping v R

Connected

cvičení

Použij predikáty k výběru uzlů podle jejich potomků

Tady je skoro stejný HTML jako předtím. Navíc má třetí div potomka p s třídou third.

<html>
  <body>
    <div id = 'first'>
      <h1 class = 'big'>Berlin Weather Station</h1>
      <p class = 'first'>Temperature: 20°C</p>
      <p class = 'second'>Humidity: 45%</p>
    </div>
    <div id = 'second'>...</div>
    <div id = 'third'>
      <p class = 'first'>Sunshine: 5hrs</p>
      <p class = 'second'>Precipitation: 0mm</p>
      <p class = 'third'>Snowfall: 0mm</p>
    </div>
  </body>
</html>

S XPathem jde udělat něco, co s CSS není možné: vybírat elementy podle vlastností jejich potomků. K tomu slouží predikáty. Cílem je vybrat jen ty div elementy, které obsahují p element s třídou third. Potřebuješ tedy vybrat jen takový div, který splňuje určitý predikát — má daného potomka (nemusí být přímý). Postupuješ krok za krokem.

Výše uvedený HTML je opět k dispozici jako weather_html.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Pomocí XPathe vyber všechny elementy div.