1. Nauka
  2. /
  3. Kursy
  4. /
  5. Projektowanie przepływów pracy uczenia maszynowego w Pythonie

Connected

ćwiczenie

Analiza kosztów w praktyce

W tym ćwiczeniu nadal pracujesz na zbiorze danych dotyczących kredytów. Przypomnij sobie, że „pozytywny" wynik w tym zbiorze oznacza „zły kredyt", czyli klienta, który nie spłacił pożyczki, a „negatywny" – klienta, który regulował zobowiązania bez problemów. Menedżer banku poinformował cię, że bank zarabia średnio 10 tys. na każdym kliencie „niskiego ryzyka", ale traci 150 tys. na każdym kliencie „wysokiego ryzyka". Twój algorytm posłuży do oceny wnioskodawców: osoby zaklasyfikowane jako „negatywne" otrzymają pożyczkę, a „pozytywne" – zostaną odrzucone. Jaki jest całkowity koszt działania twojego klasyfikatora? Dane są dostępne jako X_train, X_test, y_train i y_test. Dostępne są funkcje confusion_matrix(), f1_score(), precision_score() oraz RandomForestClassifier().

Instrukcje

100 XP
  • Dopasuj klasyfikator lasu losowego do danych treningowych.
  • Użyj go do przypisania etykiet danym testowym.
  • Wyodrębnij fałszywe przeoczenia i fałszywe alarmy z macierzy pomyłek zwróconej przez confusion_matrix(). Będziesz musiał(-a) spłaszczyć tę macierz.
  • Błędne zaklasyfikowanie klienta „dobrego" jako „złego" oznacza, że bank straciłby okazję do zarobienia 10 tys. Błędne zaklasyfikowanie klienta „złego" jako „dobrego" oznacza, że bank straciłby 150 tys. w wyniku niespłacenia pożyczki przez tego klienta.