Transformacje logarytmiczna i potęgowa

W poprzednim ćwiczeniu porównywałeś rozkłady zbioru treningowego i testowego na podstawie loan_data. To szczególnie ważny temat podczas rozmowy kwalifikacyjnej z uczenia maszynowego – zaobserwowany rozkład decyduje o tym, czy należy zastosować techniki przybliżające rozkłady cech do rozkładu normalnego, aby nie naruszać założeń o normalności.

W tym ćwiczeniu zastosujesz transformację logarytmiczną i potęgową z modułu scipy.stats na cesze Years of Credit History ze zbioru loan_data. Użyjesz też funkcji distplot() z biblioteki seaborn, która rysuje zarówno histogram rozkładu, jak i jądrowe oszacowanie gęstości.

Wszystkie potrzebne pakiety zostały już zaimportowane.

Oto twoje miejsce w potoku przetwarzania danych:

Machine learning pipeline

1
- Wybierz z loan_data kolumnę 'Years of Credit History' i narysuj jej rozkład oraz jądrowe oszacowanie gęstości (kde) za pomocą distplot().

2
- Zastosuj transformację logarytmiczną w postaci transformacji Boxa-Coxa na cr_yrs i narysuj jej rozkład oraz kde.
3
- Przekształć 'Years of Credit History' przy użyciu argumentu pierwiastka kwadratowego transformacji Boxa-Coxa i narysuj jej rozkład oraz kde.

ćwiczenie

Transformacje logarytmiczna i potęgowa

Instrukcje 1/3

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}ćwiczenie

Instrukcje 1/3

ćwiczenie