Confrontare i valori predetti

Nel precedente esercizio hai adattato sia un modello di regressione lineare sia un GLM (logistico) usando i dati crab, prevedendo y con width. In altre parole, volevi prevedere la probabilità che la femmina abbia un granchio satellite nelle vicinanze dato il suo width.

In questo esercizio esaminerai più a fondo le probabilità stimate (l'output) dai due modelli e cercherai di dedurre se l'adattamento lineare sia adatto al problema in questione.

La prassi comune è testare il modello su dati nuovi, non visti. Questo insieme di dati è chiamato campione di test.
Il campione test è stato creato per te e caricato nell'ambiente di lavoro. Nota che servono valori di test per tutte le variabili presenti nel modello, che in questo esempio è width.

L'insieme di dati crab è stato precaricato nell'ambiente di lavoro.

Questo esercizio fa parte del corso

Modelli lineari generalizzati in Python

Visualizza corso

Istruzioni dell'esercizio

Usa print() per visualizzare il set test.
Usando il campione test, calcola le probabilità stimate con .predict() sul modello lineare adattato model_LM e salva come pred_lm. Calcola anche le probabilità stimate con .predict() sul GLM (logistico) adattato salvato come model_GLM e salva come pred_glm.
Usando pandas DataFrame() combina le predizioni di entrambi i modelli e salva come predictions.
Concatena test e predictions e salva come all_data. Visualizza all_data usando print().

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# View test set
print(____)

# Compute estimated probabilities for linear model: pred_lm
____ = model_LM.____(____)

# Compute estimated probabilities for GLM model: pred_glm
____ = model_GLM.____(____)

# Create dataframe of predictions for linear and GLM model: predictions
____ = pd.DataFrame({'Pred_LM': ____, 'Pred_GLM': ____})

# Concatenate test sample and predictions and view the results
all_data = pd.concat([____, ____], axis = 1)
print(____)

Modifica ed esegui il codice