1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Web Scraping với Python

Connected

Bài tập

Bật mí qua Response

Chúng tôi đã nạp sẵn một đối tượng Response, tên là response, với nội dung từ một trang web bí mật. Nhiệm vụ của bạn là tìm ra URL và tiêu đề của trang web bằng biến response. Bạn đã học cách tìm URL ở bài trước. Để tìm tiêu đề trang, bạn cần biết rằng:

  • Tiêu đề là văn bản của phần tử title
  • Phần tử title là con của phần tử head, và head là con của phần tử gốc html.

Lưu ý: phần tử gốc html chỉ có một phần tử con head, và head chỉ có một phần tử con title.

Hướng dẫn

100 XP
  • Gán cho biến this_url URL được dùng để nạp biến response.
  • Gán cho biến this_title tiêu đề của trang web được dùng để nạp biến response. Vì bạn chỉ muốn văn bản từ đúng một phần tử được chọn, hãy dùng phương thức extract_first() để trích xuất văn bản.
  • Dù bạn dùng xpath hay css, hãy đảm bảo bạn đang chọn văn bản bên trong phần tử title, không chỉ bản thân phần tử title.