1. Nauka
  2. /
  3. Kursy
  4. /
  5. Projektowanie przepływów pracy uczenia maszynowego w Pythonie

Connected

ćwiczenie

Inżynieria cech

Twoim zadaniem jest przewidzenie, czy nowa grupa wnioskodawców kredytowych prawdopodobnie nie spłaci swoich pożyczek. Masz do dyspozycji historyczny zbiór danych i chcesz wytrenować na nim klasyfikator. Zauważasz, że wiele cech ma format tekstowy, co stanowi problem dla klasyfikatorów. Postanawiasz więc zakodować kolumny tekstowe numerycznie za pomocą LabelEncoder(). Funkcja ta została wczytana z podmodułu preprocessing biblioteki sklearn. Zbiór danych credit jest również wczytany, podobnie jak lista nazw wszystkich kolumn, których typy danych są tekstowe – przechowywana w zmiennej non_numeric_columns.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Wyświetl pierwsze trzy wiersze swoich danych za pomocą .head().