1. Nauka
  2. /
  3. Kursy
  4. /
  5. Pośrednia analityka predykcyjna w Pythonie

Connected

ćwiczenie

Naruszenie osi czasu

Aby pokazać, jak ważna jest oś czasu, przyjrzyjmy się przykładowi, w którym ją naruszamy – czyli wykorzystujemy informacje z okresu docelowego do budowy zmiennych predykcyjnych.

Dataframe basetable zawiera dwie kolumny: "amount_2017" to łączna kwota darowizn w 2017 roku, a "target" przyjmuje wartość 1, jeśli ta kwota przekracza 30, lub 0 w przeciwnym razie.

Zbuduj model regresji logistycznej, który używa kolumny "amount_2017" jako jedynej zmiennej predykcyjnej do przewidywania wartości docelowej, a następnie oblicz AUC.

Instrukcje

100 XP
  • Utwórz dataframe X zawierający zmienną predykcyjną oraz dataframe y zawierający zmienną docelową.
  • Dopasuj model regresji logistycznej tak, aby y było przewidywane na podstawie X. Zbuduj model regresji logistycznej, który używa amount_2017 jako jedynej zmiennej predykcyjnej do przewidywania target.
  • Dokonaj predykcji dla obiektów z X.
  • Oblicz i wyświetl AUC tego modelu, korzystając z funkcji roc_auc_score.