1. Nauka
  2. /
  3. Kursy
  4. /
  5. Web Scraping w R

Connected

ćwiczenie

Scrapowanie elementu na podstawie jego tekstu

Jak pokazano w filmie, funkcja text() pozwala też wybierać elementy (i ich elementy nadrzędne) na podstawie ich treści. Oto lista uporządkowana:

<h3>The rules of programming</h3>
<ol>
  <li>Have <em>fun</em>.</li>
  <li><strong>Don't</strong> repeat yourself.</li>
  <li>Think <em>twice</em> when naming variables.</li>
</ol>

W tym ćwiczeniu twoim celem jest wyodrębnienie elementu li, w którym wyraz "twice" jest wyróżniony kursywą.

Możesz pomyśleć, że znacznie łatwiej byłoby tu zastosować selektor CSS, np. li:last-child – ale poczekaj, aż ukończysz to ćwiczenie…

programming_html zawiera powyższy dokument HTML.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Na początek zaznacz wszystkie elementy li za pomocą XPATH.