1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Web Scraping bằng R

Connected

Bài tập

Chọn tất cả phần tử con của một danh sách

Cho danh sách có thứ tự sau (dùng phần tử ol), được lưu trong list_raw_html:


  1. Learn HTML
  2. Learn CSS
  3. Learn R
  4. Scrape everything!*

*Do it responsibly!


Trong bài tập này, bạn sẽ học cách dùng hàm của rvest cho phép bạn chọn trực tiếp các phần tử con của một nút nhất định.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Chuyển chuỗi HTML tương ứng (list_raw_html) thành tài liệu HTML để rvest có thể xử lý và đặt tên là list_html.