MulaiMulai sekarang secara gratis

Tautan (Hyper) Aktif

Salah satu atribut terpenting untuk diekstrak saat melakukan "web-crawling" adalah URL hyperlink (atribut href) di dalam tag a. Di sini, Anda akan mengekstrak hyperlink tersebut! Kami telah membuat fungsi print_attribute untuk mencetak data yang diekstrak dari XPath Anda, sehingga Anda dapat menguji string XPath di konsol, jika Anda mau.

Latihan ini merujuk pada kode sumber HTML berikut:

<html>
  <body>
    <div id="div1" class="class-1">
      <p class="class-1 class-2">Hello World!</p>
      <div id="div2">
        <p id="p2" class="class-2">Choose 
            <a href="http://datacamp.com">DataCamp!</a>!
        </p>
      </div>
    </div>
    <div id="div3" class="class-2">
      <p class="class-2">Thanks for Watching!</p>
    </div>
  </body>
</html>

Latihan ini adalah bagian dari kursus

Web Scraping dengan Python

Lihat Kursus

Petunjuk latihan

  • Lengkapi bagian kosong untuk menyelesaikan variabel xpath di bawah ini guna memilih nilai atribut href dari hyperlink DataCamp.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create an xpath to the href attribute
xpath = '//p[@id=____]/a/____'

# Print out the selection(s); there should be only one
print_attribute( xpath )
Edit dan Jalankan Kode