1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Supervised Learning with scikit-learn

Connected

cvičení

Odstranění chybějících hodnot

V následujících třech cvičeních si uklidíš datovou sadu music_df. Vytvoříš pipeline pro imputaci chybějících hodnot a sestavíš klasifikační model KNN, který pak použiješ k předpovědi, zda je píseň žánru "Rock".

V tomto cvičení odstraníš chybějící hodnoty, které tvoří méně než 5 % datové sady, a převedeš sloupec "genre" na binární příznak.

Pokyny 1/3

undefined XP
    1
    2
    3
  • Vypiš počet chybějících hodnot pro každý sloupec v datové sadě music_df, seřazený vzestupně.