ComeçarComece gratuitamente

Criar um modelo de regressão logística

Você já criou um modelo de árvore de decisão usando os dados dos voos. Agora você criará um modelo de regressão logística com os mesmos dados.

O objetivo é prever se um voo provavelmente sofrerá um atraso de pelo menos 15 minutos (rótulo 1) ou não (rótulo 0).

Embora você tenha uma variedade de preditores à sua disposição, você usará apenas as colunas mon, depart e duration no momento. Esses são recursos numéricos que podem ser usados imediatamente em um modelo de regressão logística. Você precisará fazer um pouco mais de trabalho antes de incluir recursos categóricos. Fique atento!

Os dados foram divididos em conjuntos de treinamento e teste e estão disponíveis em flights_train e flights_test.

Este exercício faz parte do curso

Aprendizado de máquina com PySpark

Ver Curso

Instruções de exercício

  • Importe a classe para criar um classificador de regressão logística.
  • Crie um objeto classificador e treine-o com os dados de treinamento.
  • Faça previsões para os dados de teste e crie uma matriz de confusão.

Exercício interativo prático

Experimente este exercício preenchendo este código de exemplo.

# Import the logistic regression class
from pyspark.ml.____ import ____

# Create a classifier object and train on training data
logistic = ____().____(____)

# Create predictions for the testing data and show confusion matrix
prediction = ____.____(____)
prediction.groupBy(____, ____).____().show()
Editar e executar código