1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning with scikit-learn

Connected

cvičení

Vizualizace výkonu klasifikačního modelu

V tomto cvičení budeš řešit klasifikační úlohu, kde sloupec "popularity" v datasetu music_df byl převeden na binární hodnoty: 1 označuje popularitu větší nebo rovnou mediánu sloupce "popularity" a 0 označuje popularitu pod mediánem.

Tvým úkolem je sestavit tři různé modely a vizualizovat jejich výsledky při klasifikaci, zda je píseň populární, nebo ne.

Data jsou již rozdělena, škálována a připravena jako X_train_scaled, X_test_scaled, y_train a y_test. Kromě toho jsou naimportovány KNeighborsClassifier, DecisionTreeClassifier a LogisticRegression.

Pokyny

100 XP
  • Vytvoř slovník s klíči "Logistic Regression", "KNN" a "Decision Tree Classifier" a nastav hodnoty slovníku na volání příslušných modelů.
  • Projdi hodnoty ve slovníku models ve smyčce.
  • Vytvoř objekt KFold pro 6 rozdělení, nastav shuffle na True a random_state na 12.
  • Proveď křížovou validaci s použitím modelu, škálovaných trénovacích příznaků, cílové trénovací sady a nastav cv na hodnotu kf.