Nos capítulos anteriores, você estabeleceu uma base sólida em aprendizado supervisionado, incluindo o conhecimento de como colocar modelos em produção, mas sempre assumindo que haveria um conjunto de dados rotulado disponível para sua análise. Neste capítulo, você encara o desafio de modelar dados sem rótulos — ou com pouquíssimos rótulos. Isso te leva a uma jornada por detecção de anomalias, um tipo de modelagem não supervisionada, e por aprendizado baseado em distância, onde crenças sobre o que constitui similaridade entre dois exemplos podem substituir rótulos e ajudar você a alcançar níveis de acurácia comparáveis a um workflow supervisionado. Ao concluir este capítulo, você vai se destacar por saber, com segurança, quais ferramentas usar para adaptar seu workflow e superar desafios comuns do mundo real.
Exercise 1: Detecção de anomaliasExercise 2: Um outlier simplesExercise 3: Contaminação no LoFExercise 4: Detecção de novidadesExercise 5: Uma novidade simplesExercise 6: Três detectores de novidadeExercise 7: Contaminação revisitadaExercise 8: Aprendizado baseado em distânciaExercise 9: Encontre o vizinhoExercise 10: Nem todas as métricas concordamExercise 11: Dados não estruturadosExercise 12: Levenshtein restritoExercise 13: Juntando tudoExercise 14: Considerações finais