1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Proiectarea fluxurilor de lucru pentru Machine Learning în Python

Connected

Bài tập

Analiza costurilor în context real

Vei continua să lucrezi cu setul de date despre credite. Reamintește-ți că un „pozitiv" în acest set de date înseamnă „credit rău", adică un client care nu și-a rambursat împrumutul, iar un „negativ" înseamnă un client care a continuat să plătească fără probleme. Managerul băncii te-a informat că banca obține în medie un profit de 10.000 USD de la fiecare client „cu risc scăzut", dar pierde 150.000 USD din cauza fiecărui client „cu risc ridicat". Algoritmul tău va fi folosit pentru a evalua solicitanții: cei clasificați drept „negativi" vor primi un împrumut, iar cei clasificați drept „pozitivi" vor fi respinși. Care este costul total al clasificatorului tău? Datele sunt disponibile ca X_train, X_test, y_train și y_test. Funcțiile confusion_matrix(), f1_score(), precision_score() și RandomForestClassifier() sunt disponibile.

Hướng dẫn

100 XP
  • Antrenează un clasificator de tip pădure aleatorie pe datele de antrenament.
  • Folosește-l pentru a eticheta datele de testare.
  • Extrage valorile fals negative și fals pozitive din confusion_matrix(). Va trebui să aplatizezi matricea.
  • A clasifica greșit un client „bun" drept „rău" înseamnă că banca ar fi ratat ocazia de a obține un profit de 10.000 USD. A clasifica greșit un client „rău" drept „bun" înseamnă că banca ar fi pierdut 150.000 USD din cauza nerambursării împrumutului de către client.