1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Web Scraping với Python

Connected

Bài tập

Mô tả DataCamp

Tương tự bài tập trước, đoạn mã ở đây khá dài vì bạn đang làm việc với một spider thu thập dữ liệu web hoàn chỉnh! Nhưng đừng để lượng mã làm bạn chùn bước — bạn đã nắm được cách spider hoạt động và hoàn toàn có thể hoàn thành nhiệm vụ đơn giản dưới đây!

Như ở bài trước, chúng tôi đã tạo hàm previewCourses để bạn xem trước đầu ra của spider, nhưng sau khi chạy mã bạn cũng có thể tự do khám phá dictionary dc_dict nữa.

Trong bài này, bạn cần tạo một chuỗi CSS Locator trỏ trực tiếp tới phần văn bản mô tả khóa học. Tất cả những gì bạn cần biết là: ở trang khóa học, văn bản mô tả nằm trong phần tử đoạn văn p thuộc class course__description (hai dấu gạch dưới).

Hướng dẫn

100 XP
  • Điền vào chỗ trống bên dưới trong phương thức parse_pages bằng một chuỗi CSS Locator trỏ tới phần văn bản bên trong phần tử đoạn văn p thuộc class course__description.

LƯU Ý: Nếu bạn nhấn Chạy mã, bạn phải Đặt lại về mã mẫu thì mới có thể Chạy mã lại thành công!!