1. Learn
  2. /
  3. Cursuri
  4. /
  5. Învățare supravegheată cu scikit-learn

Connected

exercițiu

Vizualizarea performanței modelelor de clasificare

În acest exercițiu, vei rezolva o problemă de clasificare în care coloana "popularity" din setul de date music_df a fost convertită la valori binare: 1 reprezintă o popularitate mai mare sau egală cu mediana coloanei "popularity", iar 0 indică o popularitate sub mediană.

Sarcina ta este să construiești și să vizualizezi rezultatele a trei modele diferite pentru a clasifica dacă o melodie este populară sau nu.

Datele au fost împărțite, scalate și preîncărcate pentru tine ca X_train_scaled, X_test_scaled, y_train și y_test. De asemenea, KNeighborsClassifier, DecisionTreeClassifier și LogisticRegression au fost deja importate.

Instrucțiuni

100 XP
  • Creează un dicționar cu cheile "Logistic Regression", "KNN" și "Decision Tree Classifier", setând valorile dicționarului la câte o instanță a fiecărui model.
  • Iterează prin valorile din models.
  • Instanțiază un obiect KFold pentru a efectua 6 împărțiri, setând shuffle la True și random_state la 12.
  • Efectuează validarea încrucișată folosind modelul, caracteristicile de antrenament scalate, setul țintă de antrenament și setând cv egal cu kf.