IniziaInizia gratis

Crea un modello di Logistic Regression

Hai già costruito un modello ad albero decisionale usando i dati dei voli. Ora creerai un modello di Logistic Regression sugli stessi dati.

L'obiettivo è prevedere se un volo rischia di avere un ritardo di almeno 15 minuti (etichetta 1) oppure no (etichetta 0).

Anche se hai a disposizione vari predittori, per il momento userai solo le colonne mon, depart e duration. Sono feature numeriche che possono essere usate subito in un modello di Logistic Regression. Dovrai fare un po' di lavoro in più prima di poter includere le feature categoriche. Resta sintonizzato!

I dati sono stati suddivisi in insieme di addestramento e di test e sono disponibili come flights_train e flights_test.

Questo esercizio fa parte del corso

Machine Learning con PySpark

Visualizza il corso

Istruzioni dell'esercizio

  • Importa la classe per creare un classificatore di Logistic Regression.
  • Crea un oggetto classificatore e addestralo sui dati di training.
  • Genera le previsioni sui dati di test e crea una matrice di confusione.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import the logistic regression class
from pyspark.ml.____ import ____

# Create a classifier object and train on training data
logistic = ____().____(____)

# Create predictions for the testing data and show confusion matrix
prediction = ____.____(____)
prediction.groupBy(____, ____).____().show()
Modifica ed esegui il codice