1. Обучение
  2. /
  3. Курса
  4. /
  5. Web Scraping w R

Connected

упражнение

Poznaj funkcję position()

Jak widziałeś(-aś) w filmie, funkcja position() jest bardzo przydatna, gdy używa się jej wewnątrz predykatu. W połączeniu z operatorami możesz wybrać praktycznie dowolny węzeł spośród tych, które pasują do danej ścieżki.

Wypróbujesz to na poniższym fragmencie HTML dostępnym przez zmienną rules_html. Przyjmijmy, że jest to na bieżąco aktualizowana strona, która wyświetla obowiązujące zasady dotyczące koronawirusa na dany dzień i dzień następny.

...
<div>
  <h2>Today's rules</h2>
  <p>Wear a mask</p>
  <p>Wash your hands</p>
</div>
<div>
  <h2>Tomorrow's rules</h2>
  <p>Wear a mask</p>
  <p>Wash your hands</p>
  <small>Bring hand sanitizer with you</small>
</div>
...

Инструкции 1/3

undefined XP
  • 1
    • Na początek wyodrębnij za pomocą XPATH tekst drugiego elementu p w każdym div.
  • 2
    • Teraz wyodrębnij tekst każdego p (z wyjątkiem drugiego) w każdym div.
  • 3
    • Wyodrębnij tekst trzech ostatnich dzieci drugiego div.
    • Do wybrania tych węzłów potomnych użyj operatora >=.