1. Nauka
  2. /
  3. Kursy
  4. /
  5. Projektowanie przepływów pracy uczenia maszynowego w Pythonie

Connected

ćwiczenie

Transformacje cech

Omawiasz zbiór danych kredytowych z menedżerem banku. Sugeruje ona, że najbezpieczniejsze wnioski kredytowe dotyczą kwot ze środkowego przedziału. Wartości zbyt niskie lub zbyt wysokie świadczą o podwyższonym ryzyku. Oznacza to, że między tą zmienną a klasą może istnieć nieliniowa zależność. Chcesz przetestować tę hipotezę. Skonstruujesz nieliniową transformację cechy, a następnie ocenisz, która z dwóch cech lepiej przewiduje klasę – użyjesz do tego SelectKBest() oraz metryki chi2(), które zostały już wczytane.

Dane są dostępne jako DataFrame biblioteki pandas o nazwie credit, a klasa znajduje się w kolumnie class. Wczytane zostały również pandas jako pd oraz numpy jako np.

Instrukcje

100 XP
  • Zdefiniuj funkcję, która przekształca wektor liczbowy, obliczając bezwzględną różnicę każdej wartości od średniej wartości tego wektora.
  • Zastosuj tę transformację do kolumny credit_amount w zbiorze danych i zapisz wynik w nowej kolumnie o nazwie diff.
  • Utwórz selektor cech SelectKBest(), który wybierze jedną z dwóch kolumn – credit_amount lub diff – korzystając z metryki chi2().
  • Sprawdź wyniki.