Logistische regressie met L1-regularization fitten

Je gaat nu een logistiek regressiemodel draaien op geschaalde data met L1-regularization om featureselectie tegelijk met het bouwen van het model uit te voeren. In de video-oefening heb je gezien hoe verschillende C-waarden invloed hebben op je accuracy-score en het aantal niet-nul-features. In deze oefening stel je de C-waarde in op 0,025.

De functies LogisticRegression en accuracy_score uit de sklearn-bibliotheek zijn alvast voor je ingeladen. Ook de geschaalde features en doelvariabelen zijn ingeladen als train_X, train_Y voor trainingsdata en test_X, test_Y voor testdata.

Deze oefening maakt deel uit van de cursus

Machine Learning voor marketing in Python

Bekijk cursus

Oefeninstructies

Initialiseer een logistieke regressie met L1-regularization en een C-waarde van 0,025.
Fit het model op de trainingsdata.
Voorspel churn-waarden op de testdata.
Print de accuracy-score van je voorspelde labels op de testdata.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Initialize logistic regression instance 
logreg = ___(penalty='l1', ___=0.025, solver='liblinear')

# Fit the model on training data
logreg.___(train_X, ___)

# Predict churn values on test data
pred_test_Y = logreg.predict(___)

# Print the accuracy score on test data
print('Test accuracy:', round(accuracy_score(test_Y, ___), 4))

Code bewerken en uitvoeren