Vorhersagen berechnen
In der Praxis wollen wir oft die angepasste logistische Regression nutzen, um Wahrscheinlichkeiten zu schätzen und Konfidenzintervalle dafür zu konstruieren. Verwende den Datensatz wells und das Modell 'switch ~ arsenic'. Angenommen, du hast neue Beobachtungen wells_test, die nicht Teil der Trainingsstichprobe waren, und möchtest die Wahrscheinlichkeit vorhersagen, zum nächstgelegenen sicheren Brunnen zu wechseln.
Das machst du mit der Methode .predict().
Beachte, dass .predict() mehrere Argumente akzeptiert:
exog– neue Beobachtungen (Testdatensatz)transform = True– wendet die Formel des Fitsy ~ xauf die Daten an.
Wenn exog nicht gesetzt ist, werden die Wahrscheinlichkeiten für den Trainingsdatensatz berechnet.
Das Modell wells_fit sowie die Datensätze wells und wells_test sind im Workspace vorab geladen.
Diese Übung ist Teil des Kurses
Generalisierte lineare Modelle in Python
Anleitung zur Übung
- Berechne mit dem angepassten Modell
wells_fitdie Vorhersage für die Testdatenwells_testund speichere sie alsprediction. - Füge
predictiondem vorhandenen DataFramewells_testals neue Spalte mit dem Namenpredictionhinzu. - Gib mit
print()die ersten 5 Zeilen vonwells_testmit den Spaltenswitch,arsenicundpredictionaus. Verwende die pandas-Funktionhead(), um nur die ersten 5 Zeilen anzuzeigen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Compute predictions for the test sample wells_test and save as prediction
prediction = ____.predict(exog = ____)
# Add prediction to the existing data frame wells_test and assign column name prediction
____[____] = ____
# Examine the first 5 computed predictions
print(____[[____, ____, ____]].head())