1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în analitica predictivă în Python

Connected

exercițiu

Variabile corelate

Primele 10 variabile adăugate în model sunt următoarele:

['max_gift', 'number_gift', 'time_since_last_gift', 'mean_gift', 'income_high', 'age', 'country_USA', 'gender_F', 'income_low', 'country_UK']

După cum poți observa, min_gift nu este inclusă. Înseamnă oare că este o variabilă slabă? Poți testa performanța ei folosind-o singură într-un model și calculând AUC-ul. Cum se compară AUC-ul variabilei min_gift cu cel al variabilei income_high? În acest scop, poți folosi funcția auc():

auc(variables, target, basetable)

Se poate întâmpla ca o variabilă bună să nu fie adăugată deoarece este puternic corelată cu o variabilă deja prezentă în model. Poți verifica acest lucru calculând corelația dintre cele două variabile:

import numpy
numpy.corrcoef(basetable["variable_1"],basetable["variable_2"])[0,1]

Instrucțiuni

100 XP
  • Calculează AUC-ul modelului folosind doar variabila min_gift.
  • Calculează AUC-ul modelului folosind doar variabila income_high.
  • Calculează corelația dintre variabila min_gift și variabila mean_gift.