Modellkoeffizienten untersuchen

Du betrachtest die Modellleistung jetzt aus einem anderen Blickwinkel und nur auf den Trainingsdaten. In der letzten Lektion hast du gelernt, dass nicht alle Modellkoeffizienten statistisch signifikant sind und wir uns die Modellzusammenfassung ansehen sollten, um ihre Signifikanz zu prüfen. Zum Glück bietet die Bibliothek statsmodels diese Funktionalität. Nachdem du die Modellzusammenfassung ausgegeben hast, untersuche, welche Variablen einen p-Wert unter 0,05 (also niedriger als 5 %) haben, um sicherzustellen, dass der Koeffizient signifikant ist.

Die Trainingsmerkmale sind als train_X geladen, und die Zielvariable als train_Y, die in ein numpy-Array umgewandelt wurde.

Diese Übung ist Teil des Kurses

Machine Learning für Marketing mit Python

Kurs anzeigen

Anleitung zur Übung

Importiere das Modul statsmodels.api.
Initialisiere eine Modellinstanz auf den Trainingsdaten mit der Funktion OLS().
Fitte das Modell.
Gib die Modellzusammenfassung mit der Methode .summary() aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import `statsmodels.api` module
import ___.___ as sm

# Initialize model instance on the training data
olsreg = sm.___(train_Y, train_X)

# Fit the model
olsreg = olsreg.___()

# Print model summary
print(olsreg.___())

Code bearbeiten und ausführen