Confrontare i valori predetti
Nel precedente esercizio hai adattato sia un modello di regressione lineare sia un GLM (logistico) usando i dati crab, prevedendo y con width. In altre parole, volevi prevedere la probabilità che la femmina abbia un granchio satellite nelle vicinanze dato il suo width.
In questo esercizio esaminerai più a fondo le probabilità stimate (l'output) dai due modelli e cercherai di dedurre se l'adattamento lineare sia adatto al problema in questione.
La prassi comune è testare il modello su dati nuovi, non visti. Questo insieme di dati è chiamato campione di test.
Il campione test è stato creato per te e caricato nell'ambiente di lavoro. Nota che servono valori di test per tutte le variabili presenti nel modello, che in questo esempio è width.
L'insieme di dati crab è stato precaricato nell'ambiente di lavoro.
Questo esercizio fa parte del corso
Modelli lineari generalizzati in Python
Istruzioni dell'esercizio
- Usa
print()per visualizzare il settest. - Usando il campione
test, calcola le probabilità stimate con.predict()sul modello lineare adattatomodel_LMe salva comepred_lm. Calcola anche le probabilità stimate con.predict()sul GLM (logistico) adattato salvato comemodel_GLMe salva comepred_glm. - Usando
pandasDataFrame()combina le predizioni di entrambi i modelli e salva comepredictions. - Concatena
testepredictionse salva comeall_data. Visualizzaall_datausandoprint().
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# View test set
print(____)
# Compute estimated probabilities for linear model: pred_lm
____ = model_LM.____(____)
# Compute estimated probabilities for GLM model: pred_glm
____ = model_GLM.____(____)
# Create dataframe of predictions for linear and GLM model: predictions
____ = pd.DataFrame({'Pred_LM': ____, 'Pred_GLM': ____})
# Concatenate test sample and predictions and view the results
all_data = pd.concat([____, ____], axis = 1)
print(____)