Perayap Capstone
Latihan ini memberi Anda kesempatan untuk menunjukkan apa yang telah Anda pelajari! Pada latihan ini, Anda akan menulis fungsi parse untuk sebuah spider lalu mengisi beberapa bagian kosong untuk menyelesaikan spider tersebut. Pada halaman direktori kursus DataCamp, setiap kursus yang terdaftar memiliki judul dan deskripsi singkat. Spider ini akan digunakan untuk men-scrape direktori kursus guna mengekstrak judul kursus dan deskripsi singkatnya. Kali ini Anda tidak perlu mengikuti tautan apa pun. Hal yang perlu Anda ketahui adalah:
- Judul kursus didefinisikan oleh teks di dalam elemen
h4yang class-nya berisi stringblock__title(garis bawah ganda). - Deskripsi singkat kursus didefinisikan oleh teks di dalam elemen paragraf
pyang class-nya berisi stringblock__description(garis bawah ganda).
Latihan ini adalah bagian dari kursus
Web Scraping dengan Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# parse method
def parse(self, response):
# Extracted course titles
crs_titles = response.xpath(____).extract()
# Extracted course descriptions
crs_descrs = response.xpath(____).extract()
# Fill in the dictionary: it is the spider output
for crs_title, crs_descr in zip(crs_titles, crs_descrs):
dc_dict[crs_title] = crs_descr