1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Web Scraping bằng R

Connected

Bài tập

Trích xuất phần tử dựa trên văn bản của nó

Như đã minh họa trong video, hàm text() cũng cho phép bạn chọn các phần tử (và phần tử cha của chúng) dựa trên văn bản. Đây là một danh sách có thứ tự:

<h3>The rules of programming</h3>
<ol>
  <li>Have <em>fun</em>.</li>
  <li><strong>Don't</strong> repeat yourself.</li>
  <li>Think <em>twice</em> when naming variables.</li>
</ol>

Trong bài tập này, mục tiêu của bạn là trích xuất phần tử li nơi "twice" được nhấn mạnh.

Bạn có thể nghĩ rằng ở đây sẽ dễ hơn nhiều nếu dùng bộ chọn CSS như li:last-child, nhưng hãy chờ đến khi bạn hoàn thành bài tập này…

programming_html chứa tài liệu HTML ở trên.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Bắt đầu bằng cách chọn tất cả các phần tử li bằng XPATH.