ComeçarComece gratuitamente

O que é regressão logística?

O modelo que você vai ajustar neste capítulo é chamado de regressão logística. Esse modelo é muito parecido com uma regressão linear, mas, em vez de prever uma variável numérica, ele prevê a probabilidade (entre 0 e 1) de um evento.

Para usar isso como um algoritmo de classificação, basta atribuir um ponto de corte a essas probabilidades. Se a probabilidade prevista estiver acima do ponto de corte, você classifica essa observação como "sim" (nesse caso, o atraso do voo); se estiver abaixo, você a classifica como "não"!

Você deve ajustar esse modelo testando valores diferentes para vários hiperparâmetros. Um hiperparâmetro é apenas um valor do modelo que não é estimado a partir dos dados, mas sim disponibilizado pelo usuário para maximizar o desempenho. Neste curso, não é necessário entender a matemática por trás de todos esses valores – o importante é que você teste algumas opções diferentes e escolha a melhor.

Por que fornecer hiperparâmetros?

Este exercício faz parte do curso

Introdução ao PySpark

Ver Curso

Exercício interativo prático

Transforme a teoria em ação com um de nossos exercícios interativos

Comece o exercício