Este exercício faz parte do curso
Aprenda a estrutura do HTML. Começaremos explicando por que a raspagem da web pode ser um acréscimo valioso à sua caixa de ferramentas de ciência de dados e, em seguida, nos aprofundaremos em alguns conceitos básicos de HTML. Encerramos o capítulo com uma breve introdução à notação XPath, usada para navegar pelos elementos de códigos HTML.
Utilize a sintaxe do XPath para explorar os seletores do scrapy. Esses dois conceitos ajudarão você a fazer a raspagem de um documento HTML.
Exercício atual
Aprenda a sintaxe de localizadores CSS e comece a brincar com a ideia de encadear localizadores CSS com o XPath. Também apresentamos os objetos Response, que se comportam como seletores, mas nos dão mais ferramentas para mobilizar nossos esforços de raspagem em vários sites.
Aprenda a criar rastreadores da web com o scrapy. Esses spiders scrapy rastreiam a web por várias páginas, seguindo os links para raspar cada uma delas automaticamente, de acordo com os procedimentos que aprendemos nos capítulos anteriores.