Tautan (Hyper) Aktif
Salah satu atribut terpenting untuk diekstrak saat melakukan "web-crawling" adalah URL hyperlink (atribut href) di dalam tag a. Di sini, Anda akan mengekstrak hyperlink tersebut! Kami telah membuat fungsi print_attribute untuk mencetak data yang diekstrak dari XPath Anda, sehingga Anda dapat menguji string XPath di konsol, jika Anda mau.
Latihan ini merujuk pada kode sumber HTML berikut:
<html>
<body>
<div id="div1" class="class-1">
<p class="class-1 class-2">Hello World!</p>
<div id="div2">
<p id="p2" class="class-2">Choose
<a href="http://datacamp.com">DataCamp!</a>!
</p>
</div>
</div>
<div id="div3" class="class-2">
<p class="class-2">Thanks for Watching!</p>
</div>
</body>
</html>
Latihan ini adalah bagian dari kursus
Web Scraping dengan Python
Petunjuk latihan
- Lengkapi bagian kosong untuk menyelesaikan variabel
xpathdi bawah ini guna memilih nilai atributhrefdari hyperlink DataCamp.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create an xpath to the href attribute
xpath = '//p[@id=____]/a/____'
# Print out the selection(s); there should be only one
print_attribute( xpath )