1. Learn
  2. /
  3. Cursuri
  4. /
  5. Analiză predictivă intermediară în Python

Connected

exercițiu

Încălcarea cronologiei

Pentru a ilustra importanța cronologiei, ia în considerare un exemplu în care aceasta este încălcată, folosind informații din perioada țintă pentru a construi variabilele predictive.

Dataframe-ul pandas basetable conține două coloane: "amount_2017" reprezintă suma totală a donațiilor din 2017, iar "target" este 1 dacă această sumă depășește 30 și 0 în caz contrar.

Construiește un model de regresie logistică care folosește "amount_2017" ca unică variabilă predictivă pentru a prezice ținta și calculează AUC.

Instrucțiuni

100 XP
  • Creează un dataframe X care conține variabila predictivă și un dataframe y care conține ținta.
  • Antrenează modelul de regresie logistică astfel încât y să fie prezis din X. Construiește un model de regresie logistică care folosește amount_2017 ca unică variabilă predictivă și prezice target.
  • Generează predicții pentru obiectele din X.
  • Calculează și afișează AUC-ul acestui model folosind funcția roc_auc_score.