Response ile Ortaya Çıkar
Gizli bir web sitesinin içeriğiyle önceden doldurulmuş, response adlı bir Response nesnesi yükledik. Görevin, response değişkenini kullanarak sitenin URL’sini ve başlığını bulmak. URL’yi nasıl bulacağını bir önceki derste öğrenmiştin. Site başlığını bulmak için bilmen gerekenler:
- Başlık,
titleöğesindeki metintir titleöğesi,headöğesinin çocuğudur;headöğesi dehtmlkök öğesinin çocuğudur.
Not: html kök öğesinin yalnızca bir tane head alt öğesi vardır ve head öğesinin de yalnızca bir tane title alt öğesi vardır.
Bu egzersiz
Python ile Web Scraping
kursunun bir parçasıdırEgzersiz talimatları
this_urldeğişkenine,responsedeğişkeninin yüklendiği URL’yi ata.this_titledeğişkenine,responsedeğişkeninin yüklendiği web sitesinin başlığını ata. Seçeceğimiz tek bir öğeden sadece metni istediğimiz için, metni çıkarmak üzereextract_first()yöntemini kullanıyoruz.- İster
xpathistercsskullan, başlık öğesinin yalnızca metnini seçtiğinden ve sadece öğenin kendisini seçmediğinden emin ol.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Get the URL to the website loaded in response
this_url = ____
# Get the title of the website loaded in response
this_title = response.____.extract_first()
# Print out our findings
print_url_title( this_url, this_title )