1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Ćwiczenie pytań rekrutacyjnych z uczenia maszynowego w Pythonie

Connected

Bài tập

Prosta imputacja

Jak widziałeś(-aś) w poprzednim ćwiczeniu, usuwanie danych może nadmiernie zmniejszyć zbiór danych. W kontekście rozmowy kwalifikacyjnej może to prowadzić do stronniczych wyników modelu uczenia maszynowego.

Bardziej elastycznym sposobem radzenia sobie z brakującymi wartościami jest ich imputacja. W Pythonie można to zrobić na wiele sposobów, jednak w tym ćwiczeniu użyjesz funkcji SimpleImputer() z modułu sklearn.impute na zbiorze loan_data.

Następnie skorzystasz z bibliotek pandas i numpy, aby przekształcić zaimputowany zbiór danych w obiekt DataFrame.

Zwróć uwagę, że do potoku zostały dodane 2 nowe kroki – Instantiate i Fit: Machine learning pipeline

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • Wybierz kolumny numeryczne ze zbioru loan_data i przypisz je do zmiennej numeric_cols.