1. Learn
  2. /
  3. Courses
  4. /
  5. Zwycięstwo w konkursie Kaggle w Pythonie

Connected

Exercise

Uzupełnianie brakujących danych

Okazuje się, że kolumny "price" i "building_id" mają brakujące wartości w zbiorze danych Rental Listing Inquiries. Przed przekazaniem danych do modeli trzeba te wartości uzupełnić.

Numeryczna cecha "price" zostanie zakodowana średnią wartością spośród dostępnych cen.

Uzupełnianie kategorycznej cechy "building_id" najczęściej występującą kategorią to zły pomysł – oznaczałoby to, że wszystkie mieszkania z brakującym "building_id" znajdują się w najpopularniejszym budynku. Lepszym rozwiązaniem jest przypisanie im nowej kategorii.

DataFrame rental_listings z danymi konkursowymi jest już wczytany.

Instructions 1/2

undefined XP
  • 1
    • Utwórz obiekt SimpleImputer ze strategią "mean".
    • Uzupełnij brakujące ceny wartością średnią.
  • 2
    • Utwórz obiekt imputera ze strategią "constant". Użyj "MISSING" jako fill_value.
    • Uzupełnij brakujące identyfikatory budynków wartością stałą.