1. Nauka
  2. /
  3. Kursy
  4. /
  5. Ćwiczenie pytań rekrutacyjnych z uczenia maszynowego w Pythonie

Connected

ćwiczenie

Polowanie na brakujące wartości

Pytania dotyczące przetwarzania brakujących wartości pojawiają się na niemal każdej rozmowie kwalifikacyjnej z zakresu uczenia maszynowego. Jeśli otrzymasz zbiór danych z brakami, ich zignorowanie może zaburzyć wyniki i obniżyć dokładność modelu.

W tym ćwiczeniu wykonasz pierwszy krok przetwarzania wstępnego: znajdziesz brakujące wartości i sprawdzisz sposoby ich obsługi za pomocą pandas i numpy na zbiorze danych o pożyczkach klientów.

Zbiór danych, którego będziesz używać w wielu ćwiczeniach tego kursu, jest zapisany w twoim środowisku roboczym jako loan_data.

Oto gdzie jesteś w potoku przetwarzania:

Machine learning pipeline

Instrukcje 1/4

undefined XP
  • 1
    • Wyświetl cechy zbioru loan_data wraz z liczbą brakujących wartości.
  • 2
    • Usuń wiersze z brakującymi wartościami i wyświetl procent pozostałych wierszy.
  • 3
    • Usuń kolumny z brakującymi wartościami i wyświetl procent pozostałych kolumn.
  • 4
    • Uzupełnij brakujące wartości w loan_data wartością 0 i zapisz wynik jako loan_data_filled.
    • Porównaj kolumnę 'Credit Score' za pomocą .describe() przed imputacją (na loan_data) i po imputacji (na loan_data_filled).