Logistische regressie met L1-regularization fitten
Je gaat nu een logistiek regressiemodel draaien op geschaalde data met L1-regularization om featureselectie tegelijk met het bouwen van het model uit te voeren. In de video-oefening heb je gezien hoe verschillende C-waarden invloed hebben op je accuracy-score en het aantal niet-nul-features. In deze oefening stel je de C-waarde in op 0,025.
De functies LogisticRegression en accuracy_score uit de sklearn-bibliotheek zijn alvast voor je ingeladen. Ook de geschaalde features en doelvariabelen zijn ingeladen als train_X, train_Y voor trainingsdata en test_X, test_Y voor testdata.
Deze oefening maakt deel uit van de cursus
Machine Learning voor marketing in Python
Oefeninstructies
- Initialiseer een logistieke regressie met L1-regularization en een
C-waarde van 0,025. - Fit het model op de trainingsdata.
- Voorspel churn-waarden op de testdata.
- Print de accuracy-score van je voorspelde labels op de testdata.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Initialize logistic regression instance
logreg = ___(penalty='l1', ___=0.025, solver='liblinear')
# Fit the model on training data
logreg.___(train_X, ___)
# Predict churn values on test data
pred_test_Y = logreg.predict(___)
# Print the accuracy score on test data
print('Test accuracy:', round(accuracy_score(test_Y, ___), 4))