MulaiMulai sekarang secara gratis

Perayap Capstone

Latihan ini memberi Anda kesempatan untuk menunjukkan apa yang telah Anda pelajari! Pada latihan ini, Anda akan menulis fungsi parse untuk sebuah spider lalu mengisi beberapa bagian kosong untuk menyelesaikan spider tersebut. Pada halaman direktori kursus DataCamp, setiap kursus yang terdaftar memiliki judul dan deskripsi singkat. Spider ini akan digunakan untuk men-scrape direktori kursus guna mengekstrak judul kursus dan deskripsi singkatnya. Kali ini Anda tidak perlu mengikuti tautan apa pun. Hal yang perlu Anda ketahui adalah:

  • Judul kursus didefinisikan oleh teks di dalam elemen h4 yang class-nya berisi string block__title (garis bawah ganda).
  • Deskripsi singkat kursus didefinisikan oleh teks di dalam elemen paragraf p yang class-nya berisi string block__description (garis bawah ganda).

Latihan ini adalah bagian dari kursus

Web Scraping dengan Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# parse method
def parse(self, response):
  # Extracted course titles
  crs_titles = response.xpath(____).extract()
  # Extracted course descriptions
  crs_descrs = response.xpath(____).extract()
  # Fill in the dictionary: it is the spider output
  for crs_title, crs_descr in zip(crs_titles, crs_descrs):
    dc_dict[crs_title] = crs_descr
Edit dan Jalankan Kode