or
Este exercício faz parte do curso
Spark é uma estrutura pra trabalhar com Big Data. Neste capítulo, você vai ver um pouco sobre o Spark e o Machine Learning. Você vai descobrir como se conectar ao Spark usando Python e carregar dados CSV.
Agora que você já sabe como colocar dados no Spark, vamos criar dois tipos de modelo de classificação: Árvores de decisão e regressão logística. Você também vai descobrir algumas abordagens para a preparação de dados.
Depois, você vai aprender a criar modelos de regressão linear. Você também vai descobrir como aumentar seus dados criando novos indicadores e uma maneira legal de escolher só os indicadores mais relevantes.
Exercício atual
Por fim, você vai aprender como deixar seus modelos mais eficientes. Você vai descobrir como usar pipelines para deixar seu código mais claro e fácil de manter. Depois, você vai usar a validação cruzada pra testar melhor seus modelos e escolher bons parâmetros de modelo. Por fim, você vai experimentar dois tipos de modelo de conjunto.