1. Nauka
  2. /
  3. Kursy
  4. /
  5. Nadzorowane uczenie maszynowe z scikit-learn

Connected

ćwiczenie

Wizualizacja wydajności modelu klasyfikacji

W tym ćwiczeniu rozwiążesz problem klasyfikacji, w którym kolumna "popularity" w zbiorze danych music_df została przekształcona do wartości binarnych: 1 oznacza popularność większą lub równą medianie kolumny "popularity", a 0 oznacza popularność poniżej mediany.

Twoim zadaniem jest zbudowanie i zwizualizowanie wyników trzech różnych modeli klasyfikujących, czy dana piosenka jest popularna.

Dane zostały podzielone, przeskalowane i wczytane jako X_train_scaled, X_test_scaled, y_train i y_test. Zaimportowano również KNeighborsClassifier, DecisionTreeClassifier i LogisticRegression.

Instrukcje

100 XP
  • Utwórz słownik z kluczami "Logistic Regression", "KNN" i "Decision Tree Classifier", przypisując jako wartości wywołania odpowiednich modeli.
  • Przeiteruj po wartościach słownika models.
  • Utwórz obiekt KFold wykonujący 6 podziałów, ustawiając shuffle na True i random_state na 12.
  • Przeprowadź walidację krzyżową, używając modelu, przeskalowanych cech treningowych, docelowego zbioru treningowego i ustawiając cv na kf.