1. Nauka
  2. /
  3. Kursy
  4. /
  5. Web Scraping w Pythonie

Connected

ćwiczenie

Odkryj za pomocą Response

Wstępnie załadowaliśmy obiekt Response o nazwie response z zawartością tajnej strony internetowej. Twoim zadaniem jest ustalenie jej URL-a i tytułu przy użyciu zmiennej response. Sposobu na znalezienie URL-a nauczyłeś się w poprzedniej lekcji. Aby znaleźć tytuł strony, musisz wiedzieć, że:

  • Tytuł to tekst z elementu title
  • Element title jest dzieckiem elementu head, który z kolei jest dzieckiem korzenia html.

Warto zaznaczyć: korzeń html ma dokładnie jeden element podrzędny head, a element head ma dokładnie jeden element podrzędny title.

Instrukcje

100 XP
  • Przypisz do zmiennej this_url URL użyty do załadowania zmiennej response.
  • Przypisz do zmiennej this_title tytuł strony internetowej użytej do załadowania zmiennej response. Ponieważ chcemy uzyskać tekst tylko z jednego wybranego elementu, użyj metody extract_first(), aby go wyodrębnić.
  • Niezależnie od tego, czy korzystasz z xpath, czy css, upewnij się, że wybierasz tekst wewnątrz elementu title, a nie sam element title.