1. Nauka
  2. /
  3. Kursy
  4. /
  5. Web Scraping w Pythonie

Connected

ćwiczenie

Pseudonimy

W tym ćwiczeniu masz do dyspozycji klasę pająka, która – po uzupełnieniu – pobierze imiona i nazwiska autorów ze skróconej wersji katalogu kursów DataCamp. URL tej skróconej wersji jest przechowywany w zmiennej url_short. Twoim zadaniem jest utworzenie listy wyodrębnionych imion i nazwisk autorów w metodzie parse pająka.

Dwie ważne informacje:

  • Będziesz korzystać z obiektu response i metody css.
  • Imiona i nazwiska autorów kursów są zdefiniowane przez tekst zawarty w elementach akapitu p należących do klasy course-block__author-name

Możesz sprawdzić działanie pająka za pomocą funkcji inspect_spider(), którą dla ciebie przygotowaliśmy – wyświetli ona znalezione imiona i nazwiska autorów!

Pamiętaj, że to i pozostałe ćwiczenia w tym rozdziale mogą wymagać chwili na załadowanie.

Instrukcje

100 XP
  • Uzupełnij wymagane argumenty metody parse, tak aby działała poprawnie po wywołaniu w metodzie start_requests.
  • Wewnątrz metody parse utwórz zmienną author_names – listę ciągów znaków powstałą przez wyodrębnienie tekstu z elementów akapitu należących do klasy course-block__author-name.