1. Nauka
  2. /
  3. Kursy
  4. /
  5. Web Scraping w R

Connected

ćwiczenie

Wybieranie po klasie i ID za pomocą XPATH

Oto kod HTML podobny do tego, który już poznałeś w poprzednim rozdziale (wczytany do dokumentu HTML o nazwie weather_html):

<html>
  <body>
    <div id = 'first'>
      <h1 class = 'big'>Berlin Weather Station</h1>
      <p class = 'first'>Temperature: 20°C</p>
      <p class = 'second'>Humidity: 45%</p>
    </div>
    <div id = 'second'>...</div>
    <div id = 'third'>
      <p class = 'first'>Sunshine: 5hrs</p>
      <p class = 'second'>Precipitation: 0mm</p>
    </div>
  </body>
</html>

W tym rozdziale kod wygląda już bardziej jak rzeczywisty przykład. Twoim celem jest wyodrębnienie odczytu opadów z tej stacji pogodowej. Niestety, nie można się do niego odwołać bezpośrednio przez ID.

Przejdźmy przez to krok po kroku – najpierw zbuduj poszczególne elementy, a potem połącz je w całość!

Instrukcje 1/4

undefined XP
  • 1
    • Na rozgrzewkę zaznacz wszystkie tagi p w powyższym kodzie HTML, używając XPATH.
  • 2
    • Teraz wybierz tylko elementy p z klasą second.
  • 3
    • Teraz wybierz wszystkie elementy p, które są bezpośrednimi potomkami elementu o ID third.
  • 4
    • Teraz wybierz tylko element p z klasą second, który jest bezpośrednim potomkiem elementu #third – ponownie używając XPATH.