or
Deze oefening maakt deel uit van de cursus
Leer de structuur van HTML. We beginnen met waarom webscraping een waardevolle aanvulling op je data science-gereedschapskist kan zijn en duiken vervolgens in de basis van HTML. We sluiten het hoofdstuk af met een korte introductie van XPath-notatie, waarmee je door elementen in HTML-code navigeert.
Huidige oefening
Maak gebruik van XPath-syntax om scrapy-selectors te verkennen. Beide concepten brengen je dichter bij het kunnen scrapen van een HTML-document.
Leer de syntax van CSS-locators en ga aan de slag met het idee om CSS-locators te chainen met XPath. We introduceren ook Response-objecten, die zich gedragen als selectors maar extra tools bieden om je scraping over meerdere websites te versnellen.
Leer webcrawlers maken met scrapy. Deze scrapy-spiders crawlen het web over meerdere pagina’s, volgen links en scrapen elke pagina automatisch volgens de stappen die we in de vorige hoofdstukken hebben geleerd.