1. Nauka
  2. /
  3. Kursy
  4. /
  5. Nadzorowane uczenie maszynowe z scikit-learn

Connected

ćwiczenie

Tworzenie zmiennych zastępczych

Uwzględnienie cech kategorycznych w procesie budowania modelu może poprawić jego wydajność – dostarczają one informacji, które przyczyniają się do dokładniejszych predykcji.

Zbiór danych music_df jest już wczytany, a jego kształt jest wyświetlony. Biblioteka pandas została zaimportowana jako pd.

Teraz utworzysz nowy DataFrame zawierający oryginalne kolumny z music_df oraz zmienne zastępcze (dummy variables) utworzone na podstawie kolumny "genre".

Instrukcje

100 XP
  • Użyj odpowiedniej funkcji, przekazując cały DataFrame music_df, aby utworzyć music_dummies – upewnij się, że usuwasz pierwszą kolumnę binarną.
  • Wyświetl kształt music_dummies.