1. Learn
  2. /
  3. Курси
  4. /
  5. Кероване навчання зі scikit-learn

Connected

вправа

Візуалізація продуктивності моделей класифікації

У цій вправі ви розв'язуватимете задачу класифікації, де стовпчик "popularity" у наборі даних music_df перетворено на бінарні значення: 1 означає популярність, більшу або рівну медіані для стовпчика "popularity", а 0 — популярність нижчу за медіану.

Ваше завдання — побудувати та візуалізувати результати трьох різних моделей, щоб визначати, чи є пісня популярною.

Дані вже розбиті, масштабовані та завантажені як X_train_scaled, X_test_scaled, y_train і y_test. Крім того, імпортовано KNeighborsClassifier, DecisionTreeClassifier та LogisticRegression.

Інструкції

100 XP
  • Створіть словник з "Logistic Regression", "KNN" і "Decision Tree Classifier", задавши значеннями словника виклик кожної з моделей.
  • Пройдіться циклом за значеннями в models.
  • Створіть об'єкт KFold для 6 розбиттів, встановивши shuffle у True та random_state у 12.
  • Виконайте перехресну перевірку, використовуючи модель, масштабовані тренувальні ознаки, тренувальну ціль та встановивши cv рівним kf.