1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Intermediate Predictive Analytics in Python

Connected

Cvičení

Porušení časové osy

Pro ilustraci důležitosti časové osy si ukážeme příklad, kdy ji porušíme a použijeme informace z cílového období k sestavení prediktivních proměnných.

V pandas dataframu basetable jsou dva sloupce: "amount_2017" obsahuje celkovou výši darů v roce 2017 a "target" nabývá hodnoty 1, pokud je tato výše větší než 30, jinak 0.

Sestav model logistické regrese, který používá "amount_2017" jako jedinou prediktivní proměnnou k předpovědi cílové proměnné, a vypočítej AUC.

Pokyny

100 XP
  • Vytvoř dataframe X obsahující prediktivní proměnnou a dataframe y obsahující cílovou proměnnou.
  • Natrénuj model logistické regrese tak, aby předpovídal y na základě X. Sestav model logistické regrese, který používá amount_2017 jako jedinou prediktivní proměnnou a předpovídá target.
  • Vytvoř predikce pro objekty v X.
  • Vypočítej a vypiš AUC tohoto modelu pomocí funkce roc_auc_score.