LoslegenKostenlos loslegen

Vorhersagen berechnen

In der Praxis wollen wir oft die angepasste logistische Regression nutzen, um Wahrscheinlichkeiten zu schätzen und Konfidenzintervalle dafür zu konstruieren. Verwende den Datensatz wells und das Modell 'switch ~ arsenic'. Angenommen, du hast neue Beobachtungen wells_test, die nicht Teil der Trainingsstichprobe waren, und möchtest die Wahrscheinlichkeit vorhersagen, zum nächstgelegenen sicheren Brunnen zu wechseln.

Das machst du mit der Methode .predict().

Beachte, dass .predict() mehrere Argumente akzeptiert:

  • exog – neue Beobachtungen (Testdatensatz)
  • transform = True – wendet die Formel des Fits y ~ x auf die Daten an.

Wenn exog nicht gesetzt ist, werden die Wahrscheinlichkeiten für den Trainingsdatensatz berechnet.

Das Modell wells_fit sowie die Datensätze wells und wells_test sind im Workspace vorab geladen.

Diese Übung ist Teil des Kurses

Generalisierte lineare Modelle in Python

Kurs anzeigen

Anleitung zur Übung

  • Berechne mit dem angepassten Modell wells_fit die Vorhersage für die Testdaten wells_test und speichere sie als prediction.
  • Füge prediction dem vorhandenen DataFrame wells_test als neue Spalte mit dem Namen prediction hinzu.
  • Gib mit print() die ersten 5 Zeilen von wells_test mit den Spalten switch, arsenic und prediction aus. Verwende die pandas-Funktion head(), um nur die ersten 5 Zeilen anzuzeigen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Compute predictions for the test sample wells_test and save as prediction
prediction = ____.predict(exog = ____)

# Add prediction to the existing data frame wells_test and assign column name prediction
____[____] = ____

# Examine the first 5 computed predictions
print(____[[____, ____, ____]].head())
Code bearbeiten und ausführen