Vorhergesagte Werte vergleichen
In der vorherigen Übung hast du sowohl ein lineares als auch ein GLM (logistisches) Regressionsmodell mit den crab-Daten angepasst und y mit width vorhergesagt. Anders gesagt: Du wolltest die Wahrscheinlichkeit vorhersagen, dass ein Weibchen eine Satellitenkrabbe in seiner Nähe hat, gegeben ihre Breite.
In dieser Übung untersuchst du die geschätzten Wahrscheinlichkeiten (die Ausgaben) der beiden Modelle weiter und versuchst abzuleiten, ob der lineare Fit für das vorliegende Problem geeignet wäre.
Üblicherweise testet man das Modell an neuen, noch nicht gesehenen Daten. Ein solcher Datensatz heißt Test-Stichprobe.
Die test-Stichprobe wurde für dich erstellt und in den Workspace geladen. Beachte, dass du Testwerte für alle im Modell enthaltenen Variablen brauchst, was in diesem Beispiel width ist.
Der crab-Datensatz wurde im Workspace vorgeladen.
Diese Übung ist Teil des Kurses
Generalisierte lineare Modelle in Python
Anleitung zur Übung
- Gib mit
print()dastest-Set aus. - Berechne mit der
test-Stichprobe die geschätzten Wahrscheinlichkeiten mittels.predict()auf dem angepassten linearen Modellmodel_LMund speichere sie alspred_lm. Berechne außerdem die geschätzten Wahrscheinlichkeiten mittels.predict()auf dem angepassten GLM (logistischen) Modellmodel_GLMund speichere sie alspred_glm. - Kombiniere die Vorhersagen beider Modelle mit
pandasDataFrame()und speichere sie alspredictions. - Konkatenieren
testundpredictionsund speichere sie alsall_data. Giball_datamitprint()aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# View test set
print(____)
# Compute estimated probabilities for linear model: pred_lm
____ = model_LM.____(____)
# Compute estimated probabilities for GLM model: pred_glm
____ = model_GLM.____(____)
# Create dataframe of predictions for linear and GLM model: predictions
____ = pd.DataFrame({'Pred_LM': ____, 'Pred_GLM': ____})
# Concatenate test sample and predictions and view the results
all_data = pd.concat([____, ____], axis = 1)
print(____)