1. Learn
  2. /
  3. Courses
  4. /
  5. Importowanie danych w Pythonie – poziom średniozaawansowany

Connected

Exercise

Przekształcanie strony internetowej w dane za pomocą BeautifulSoup: pobieranie hiperłączy

W tym ćwiczeniu dowiesz się, jak wyodrębnić adresy URL hiperłączy ze strony BDFL. Przy okazji dobrze poznasz metodę find_all() obiektu soup.

Instructions

100 XP
  • Użyj metody find_all(), aby znaleźć wszystkie hiperłącza w obiekcie soup. Pamiętaj, że hiperłącza są oznaczane tagiem HTML <a>, który przekazujesz do find_all() bez nawiasów kątowych. Wynik zapisz w zmiennej a_tags.
  • Zmienna a_tags zawiera zbiór wyników: twoim zadaniem jest teraz przejście przez nią za pomocą pętli for i wyświetlenie rzeczywistych adresów URL hiperłączy. W tym celu, dla każdego elementu link w a_tags, wywołaj print() z argumentem link.get('href').