Vorhergesagte Werte vergleichen

In der vorherigen Übung hast du sowohl ein lineares als auch ein GLM (logistisches) Regressionsmodell mit den crab-Daten angepasst und y mit width vorhergesagt. Anders gesagt: Du wolltest die Wahrscheinlichkeit vorhersagen, dass ein Weibchen eine Satellitenkrabbe in seiner Nähe hat, gegeben ihre Breite.

In dieser Übung untersuchst du die geschätzten Wahrscheinlichkeiten (die Ausgaben) der beiden Modelle weiter und versuchst abzuleiten, ob der lineare Fit für das vorliegende Problem geeignet wäre.

Üblicherweise testet man das Modell an neuen, noch nicht gesehenen Daten. Ein solcher Datensatz heißt Test-Stichprobe.
Die test-Stichprobe wurde für dich erstellt und in den Workspace geladen. Beachte, dass du Testwerte für alle im Modell enthaltenen Variablen brauchst, was in diesem Beispiel width ist.

Der crab-Datensatz wurde im Workspace vorgeladen.

Diese Übung ist Teil des Kurses

Generalisierte lineare Modelle in Python

Kurs anzeigen

Anleitung zur Übung

Gib mit print() das test-Set aus.
Berechne mit der test-Stichprobe die geschätzten Wahrscheinlichkeiten mittels .predict() auf dem angepassten linearen Modell model_LM und speichere sie als pred_lm. Berechne außerdem die geschätzten Wahrscheinlichkeiten mittels .predict() auf dem angepassten GLM (logistischen) Modell model_GLM und speichere sie als pred_glm.
Kombiniere die Vorhersagen beider Modelle mit pandas DataFrame() und speichere sie als predictions.
Konkatenieren test und predictions und speichere sie als all_data. Gib all_data mit print() aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# View test set
print(____)

# Compute estimated probabilities for linear model: pred_lm
____ = model_LM.____(____)

# Compute estimated probabilities for GLM model: pred_glm
____ = model_GLM.____(____)

# Create dataframe of predictions for linear and GLM model: predictions
____ = pd.DataFrame({'Pred_LM': ____, 'Pred_GLM': ____})

# Concatenate test sample and predictions and view the results
all_data = pd.concat([____, ____], axis = 1)
print(____)

Code bearbeiten und ausführen