1. Learn
  2. /
  3. Courses
  4. /
  5. Web Scraping w Pythonie

Connected

Exercise

Hiper(łącze) w akcji

Jednym z najważniejszych atrybutów do pobrania podczas „crawlowania" stron jest adres URL hiperłącza (atrybut href) zawarty w tagu a. W tym ćwiczeniu właśnie taki atrybut wyodrębnisz! Stworzyliśmy funkcję print_attribute, która wyświetla dane pobrane przez twój XPath – możesz testować wyrażenia XPath w konsoli, jeśli chcesz.

Ćwiczenie odnosi się do następującego kodu HTML:

<html>
  <body>
    <div id="div1" class="class-1">
      <p class="class-1 class-2">Hello World!</p>
      <div id="div2">
        <p id="p2" class="class-2">Choose 
            <a href="http://datacamp.com">DataCamp!</a>!
        </p>
      </div>
    </div>
    <div id="div3" class="class-2">
      <p class="class-2">Thanks for Watching!</p>
    </div>
  </body>
</html>

Instructions

100 XP
  • Uzupełnij puste miejsca w zmiennej xpath poniżej, aby wybrać wartość atrybutu href z hiperłącza DataCamp.