1. Nauka
  2. /
  3. Kursy
  4. /
  5. Ćwiczenie pytań rekrutacyjnych z uczenia maszynowego w Pythonie

Connected

ćwiczenie

Transformacje logarytmiczna i potęgowa

W poprzednim ćwiczeniu porównywałeś rozkłady zbioru treningowego i testowego na podstawie loan_data. To szczególnie ważny temat podczas rozmowy kwalifikacyjnej z uczenia maszynowego – zaobserwowany rozkład decyduje o tym, czy należy zastosować techniki przybliżające rozkłady cech do rozkładu normalnego, aby nie naruszać założeń o normalności.

W tym ćwiczeniu zastosujesz transformację logarytmiczną i potęgową z modułu scipy.stats na cesze Years of Credit History ze zbioru loan_data. Użyjesz też funkcji distplot() z biblioteki seaborn, która rysuje zarówno histogram rozkładu, jak i jądrowe oszacowanie gęstości.

Wszystkie potrzebne pakiety zostały już zaimportowane.

Oto twoje miejsce w potoku przetwarzania danych:

Machine learning pipeline

Instrukcje 1/3

undefined XP
  • 1
    • Wybierz z loan_data kolumnę 'Years of Credit History' i narysuj jej rozkład oraz jądrowe oszacowanie gęstości (kde) za pomocą distplot().
  • 2
    • Zastosuj transformację logarytmiczną w postaci transformacji Boxa-Coxa na cr_yrs i narysuj jej rozkład oraz kde.
  • 3
    • Przekształć 'Years of Credit History' przy użyciu argumentu pierwiastka kwadratowego transformacji Boxa-Coxa i narysuj jej rozkład oraz kde.