or
Questo esercizio fa parte del corso
Impara la struttura di HTML. Iniziamo spiegando perché il web scraping può essere un’aggiunta preziosa alla tua cassetta degli attrezzi per la data science e poi approfondiamo alcune basi di HTML. Concludiamo il capitolo con una breve introduzione alla notazione XPath, usata per navigare tra gli elementi all’interno del codice HTML.
Esercizio attuale
Sfrutta la sintassi XPath per esplorare i selettori di scrapy. Entrambi questi concetti ti porteranno verso la capacità di estrarre dati da un documento HTML.
Impara la sintassi dei Locator CSS e inizia a sperimentare l’idea di concatenare Locator CSS con XPath. Introduciamo anche gli oggetti Response, che si comportano come i Selector ma offrono strumenti extra per ampliare le attività di scraping su più siti web.
Impara a creare crawler web con scrapy. Questi spider di scrapy esploreranno il web attraverso più pagine, seguendo i link per estrarre automaticamente ciascuna di esse secondo le procedure che abbiamo visto nei capitoli precedenti.