Vizualizarea performanței modelelor de clasificare

În acest exercițiu, vei rezolva o problemă de clasificare în care coloana "popularity" din setul de date music_df a fost convertită la valori binare: 1 reprezintă o popularitate mai mare sau egală cu mediana coloanei "popularity", iar 0 indică o popularitate sub mediană.

Sarcina ta este să construiești și să vizualizezi rezultatele a trei modele diferite pentru a clasifica dacă o melodie este populară sau nu.

Datele au fost împărțite, scalate și preîncărcate pentru tine ca X_train_scaled, X_test_scaled, y_train și y_test. De asemenea, KNeighborsClassifier, DecisionTreeClassifier și LogisticRegression au fost deja importate.

Creează un dicționar cu cheile "Logistic Regression", "KNN" și "Decision Tree Classifier", setând valorile dicționarului la câte o instanță a fiecărui model.
Iterează prin valorile din models.
Instanțiază un obiect KFold pentru a efectua 6 împărțiri, setând shuffle la True și random_state la 12.
Efectuează validarea încrucișată folosind modelul, caracteristicile de antrenament scalate, setul țintă de antrenament și setând cv egal cu kf.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}exercițiu

Instrucțiuni

exercițiu