1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Introduction to Predictive Analytics in Python

Connected

cvičení

Korelované proměnné

Prvních 10 proměnných přidaných do modelu je následujících:

['max_gift', 'number_gift', 'time_since_last_gift', 'mean_gift', 'income_high', 'age', 'country_USA', 'gender_F', 'income_low', 'country_UK']

Jak vidíš, min_gift přidána nebyla. Znamená to, že je to špatná proměnná? Výkon proměnné můžeš otestovat tak, že ji použiješ jako jedinou proměnnou v modelu a vypočítáš AUC. Jak si stojí AUC proměnné min_gift ve srovnání s AUC proměnné income_high? K tomu slouží funkce auc():

auc(variables, target, basetable)

Může se stát, že dobrá proměnná není přidána, protože je silně korelovaná s proměnnou, která už v modelu je. Tuto korelaci můžeš ověřit takto:

import numpy
numpy.corrcoef(basetable["variable_1"],basetable["variable_2"])[0,1]

Pokyny

100 XP
  • Vypočítej AUC modelu obsahujícího pouze proměnnou min_gift.
  • Vypočítej AUC modelu obsahujícího pouze proměnnou income_high.
  • Vypočítej korelaci mezi proměnnými min_gift a mean_gift.