1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

Exercise

Kodowanie One-Hot

Problem z kodowaniem etykietowym polega na tym, że niejawnie zakłada ono istnienie zależności rangowej między kategoriami. Zmieńmy więc metodę kodowania cech "RoofStyle" i "CentralAir" na kodowanie one-hot. Jak poprzednio, ramki danych train i test z konkursu Kaggle House Prices są już dostępne w twoim środowisku.

Pamiętaj, że w przypadku cech binarnych (cech kategorycznych z tylko dwiema kategoriami) zaleca się stosowanie wyłącznie kodera etykietowego.

Twoim celem jest ustalenie, która z wymienionych cech nie jest binarna, i zastosowanie kodowania one-hot tylko do niej.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Zbadaj rozkład cech "RoofStyle" i "CentralAir" przy użyciu metody value_counts() z biblioteki pandas.