1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. Nhập dữ liệu nâng cao trong Python

Connected

अभ्यास

Biến một trang web thành dữ liệu với BeautifulSoup: lấy văn bản

Như đã hứa, trong các bài tập sau, bạn sẽ học những điều cơ bản để trích xuất thông tin từ HTML soup. Ở bài này, bạn sẽ tìm cách lấy phần văn bản từ trang của BDFL, đồng thời in ra tiêu đề của trang.

निर्देश

100 XP
  • Trong mã mẫu, đối tượng phản hồi HTML html_doc đã được tạo sẵn: nhiệm vụ đầu tiên của bạn là chuyển nó thành Soup bằng hàm BeautifulSoup() và gán soup thu được cho biến soup.
  • Trích xuất tiêu đề từ HTML soup soup bằng thuộc tính title và gán kết quả cho guido_title.
  • In tiêu đề trang web của Guido ra shell bằng hàm print().
  • Trích xuất văn bản từ HTML soup soup bằng phương thức get_text() và gán cho guido_text.
  • Nhấn Gửi để in văn bản từ trang web của Guido ra shell.