Vorhersagen berechnen

In der Praxis wollen wir oft die angepasste logistische Regression nutzen, um Wahrscheinlichkeiten zu schätzen und Konfidenzintervalle dafür zu konstruieren. Verwende den Datensatz wells und das Modell 'switch ~ arsenic'. Angenommen, du hast neue Beobachtungen wells_test, die nicht Teil der Trainingsstichprobe waren, und möchtest die Wahrscheinlichkeit vorhersagen, zum nächstgelegenen sicheren Brunnen zu wechseln.

Das machst du mit der Methode .predict().

Beachte, dass .predict() mehrere Argumente akzeptiert:

exog – neue Beobachtungen (Testdatensatz)
transform = True – wendet die Formel des Fits y ~ x auf die Daten an.

Wenn exog nicht gesetzt ist, werden die Wahrscheinlichkeiten für den Trainingsdatensatz berechnet.

Das Modell wells_fit sowie die Datensätze wells und wells_test sind im Workspace vorab geladen.

Diese Übung ist Teil des Kurses

Generalisierte lineare Modelle in Python

Kurs anzeigen

Anleitung zur Übung

Berechne mit dem angepassten Modell wells_fit die Vorhersage für die Testdaten wells_test und speichere sie als prediction.
Füge prediction dem vorhandenen DataFrame wells_test als neue Spalte mit dem Namen prediction hinzu.
Gib mit print() die ersten 5 Zeilen von wells_test mit den Spalten switch, arsenic und prediction aus. Verwende die pandas-Funktion head(), um nur die ersten 5 Zeilen anzuzeigen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Compute predictions for the test sample wells_test and save as prediction
prediction = ____.predict(exog = ____)

# Add prediction to the existing data frame wells_test and assign column name prediction
____[____] = ____

# Examine the first 5 computed predictions
print(____[[____, ____, ____]].head())

Code bearbeiten und ausführen