1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Web Scraping bằng R

Connected

Bài tập

Chọn nhiều kiểu HTML

Như bạn đã thấy trong video, CSS có thể dùng để tạo kiểu cho một trang web. Ở dạng cơ bản nhất, việc này diễn ra thông qua các selector theo kiểu (type selector), nơi các kiểu dáng được định nghĩa và áp dụng cho tất cả các phần tử HTML của một kiểu nhất định. Đổi lại, bạn cũng có thể dùng type selector để thu thập (scrape) các phần tử HTML cụ thể trên trang.

Như đã minh họa trong video, bạn cũng có thể kết hợp nhiều type selector bằng dấu phẩy, tức là với html_elements("type1, type2"). Cách này sẽ chọn tất cả phần tử có type1 hoặc type2.

Hãy xem đoạn HTML sau:

<html> 
  <body> 
    <div>Python is perfect for programming.</div>
    <p>Still, R might be better suited for data analysis.</p>
    <small>(And has prettier charts, too.)</small>
  </body> 
</html>

Mã HTML thô được cung cấp trong biến languages_raw_html.

Hướng dẫn

100 XP
  • Đọc biến languages_raw_html.
  • Dùng phương pháp ở trên để chọn tất cả phần tử div và p trong HTML này.