Logistisch regressiemodel fitten
Logistische regressie is een eenvoudig maar krachtig classificatiemodel dat in veel verschillende use cases wordt gebruikt. Je gaat nu een logistische regressie fitten op het trainingsgedeelte van de telecom-churngegevensset en vervolgens labels voorspellen op de onzichtbare testset. Daarna bereken je de nauwkeurigheid van je modelvoorspellingen.
De functie accuracy_score is geïmporteerd en een LogisticRegression-instantie uit sklearn is geïnitialiseerd als logreg. De eerder samengestelde trainings- en testgegevens zijn geladen als train_X en test_X voor de features, en train_Y en test_Y voor de doelvariabelen.
Deze oefening maakt deel uit van de cursus
Machine Learning voor marketing in Python
Oefeninstructies
- Fit een logistische regressie op de trainingsdata.
- Voorspel churn-labels voor de testdata.
- Bereken de accuracy score op de testdata.
- Print de testnauwkeurigheid afgerond op 4 decimalen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit logistic regression on training data
logreg.___(train_X, train_Y)
# Predict churn labels on testing data
pred_test_Y = ___.predict(test_X)
# Calculate accuracy score on testing data
test_accuracy = ___(test_Y, pred_test_Y)
# Print test accuracy score rounded to 4 decimals
print('Test accuracy:', ___(test_accuracy, 4))