O que é regressão logística?
O modelo que você vai ajustar neste capítulo é chamado de regressão logística. Esse modelo é muito parecido com uma regressão linear, mas, em vez de prever uma variável numérica, ele prevê a probabilidade (entre 0 e 1) de um evento.
Para usar isso como um algoritmo de classificação, basta atribuir um ponto de corte a essas probabilidades. Se a probabilidade prevista estiver acima do ponto de corte, você classifica essa observação como "sim" (nesse caso, o atraso do voo); se estiver abaixo, você a classifica como "não"!
Você deve ajustar esse modelo testando valores diferentes para vários hiperparâmetros. Um hiperparâmetro é apenas um valor do modelo que não é estimado a partir dos dados, mas sim disponibilizado pelo usuário para maximizar o desempenho. Neste curso, não é necessário entender a matemática por trás de todos esses valores – o importante é que você teste algumas opções diferentes e escolha a melhor.
Por que fornecer hiperparâmetros?
Este exercício faz parte do curso
Introdução ao PySpark
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
