1. Learn
  2. /
  3. Courses
  4. /
  5. Proiectarea fluxurilor de lucru pentru Machine Learning în Python

Connected

Exercise

Transformări ale caracteristicilor

Discuți setul de date despre credite cu directoarea băncii. Aceasta sugerează că cele mai sigure cereri de împrumut tind să solicite sume de credit în intervalul mediu. Valorile prea mici sau prea mari indică un risc ridicat. Prin urmare, este posibil să existe o relație neliniară între această variabilă și clasă. Vrei să testezi această ipoteză. Vei construi o transformare neliniară a caracteristicii, apoi vei evalua care dintre cele două caracteristici prezice mai bine clasa, folosind SelectKBest() și metrica chi2(), ambele preîncărcate.

Datele sunt disponibile ca DataFrame pandas numit credit, iar clasa se află în coloana class. Ai, de asemenea, preîncărcate pandas ca pd și numpy ca np.

Instructions

100 XP
  • Definește o funcție care transformă un vector numeric calculând diferența absolută a fiecărei valori față de valoarea medie a vectorului.
  • Aplică această transformare coloanei credit_amount din setul de date și stochează rezultatul într-o nouă coloană numită diff.
  • Creează un selector de caracteristici SelectKBest() care să aleagă una dintre cele două coloane, credit_amount și diff, folosind metrica chi2().
  • Inspectează rezultatele.