1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Introduction to Predictive Analytics in Python

Connected

cvičení

Sestavení křivek AUC

Postup dopředného postupného výběru proměnných určuje pořadí, ve kterém se proměnné optimálně přidávají do sady prediktorů. Abys mohl/a rozhodnout, kde výběr ukončit, můžeš vykreslit křivky AUC pro trénovací a testovací data. Tyto křivky zobrazují hodnoty AUC pro první, první dvě, první tři, … proměnné zahrnuté v modelu.

V tomto cvičení se naučíš tyto křivky AUC vykreslit. Metoda auc_train_test pro výpočet hodnot AUC je již implementována a lze ji použít takto:

auc_train, auc_test = auc_train_test(variables, target, train, test)

kde variables je sada proměnných použitých v modelu logistické regrese, target je seznam s názvem cílové proměnné a train a test jsou trénovací a testovací základní tabulka.

Proměnné seřazené podle dopředného postupného postupu jsou uvedeny v seznamu variables. Můžeš si ho prozkoumat v konzoli. Navíc jsou pro tebe připraveny tři prázdné seznamy:

  • auc_values_train, který bude obsahovat hodnoty AUC trénovacího modelu v každé iteraci
  • auc_values_test, který bude obsahovat hodnoty AUC testovacího modelu v každé iteraci
  • variables_evaluate, který bude obsahovat proměnné vyhodnocované v každé iteraci

Pokyny

100 XP
  • Iteruj přes proměnné.
  • V každé iteraci přidej další proměnnou ze seznamu variables do variables_evaluate.
  • V každé iteraci vypočítej trénovací a testovací AUC pomocí metody auc_train_test. DataFramy train a test obsahují trénovací a testovací data.
  • V každé iteraci přidej vypočítané hodnoty do auc_values_train a auc_values_test.