Tautan (Hyper) Aktif

Salah satu atribut terpenting untuk diekstrak saat melakukan "web-crawling" adalah URL hyperlink (atribut href) di dalam tag a. Di sini, Anda akan mengekstrak hyperlink tersebut! Kami telah membuat fungsi print_attribute untuk mencetak data yang diekstrak dari XPath Anda, sehingga Anda dapat menguji string XPath di konsol, jika Anda mau.

Latihan ini merujuk pada kode sumber HTML berikut:

<html>
  <body>
    <div id="div1" class="class-1">
      <p class="class-1 class-2">Hello World!</p>
      <div id="div2">
        <p id="p2" class="class-2">Choose 
            <a href="http://datacamp.com">DataCamp!</a>!
        </p>
      </div>
    </div>
    <div id="div3" class="class-2">
      <p class="class-2">Thanks for Watching!</p>
    </div>
  </body>
</html>

Latihan ini merupakan bagian dari kursus

Web Scraping dengan Python

Lihat Kursus

Instruksi latihan

Lengkapi bagian kosong untuk menyelesaikan variabel xpath di bawah ini guna memilih nilai atribut href dari hyperlink DataCamp.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create an xpath to the href attribute
xpath = '//p[@id=____]/a/____'

# Print out the selection(s); there should be only one
print_attribute( xpath )

Edit dan Jalankan Kode