1. Nauka
  2. /
  3. Kursy
  4. /
  5. Pośrednia analityka predykcyjna w Pythonie

Connected

ćwiczenie

Populacja zgodna z harmonogramem

Załóżmy, że chcesz zbudować tabelę bazową dla modelu predykcyjnego, który przewiduje, czy darczyńcy przekażą darowiznę w 2018 roku. Harmonogram wskazuje, że populacja powinna obejmować wszystkich darczyńców, którzy dokonali co najmniej jednej darowizny od 1 stycznia 2013 roku, ale nie dokonali żadnej darowizny po 1 stycznia 2017 roku. Dane wejściowe stanowi ramka danych pandas gifts zawierająca wszystkie darowizny od 2010 roku. W tym ćwiczeniu zbudujesz zbiór z identyfikatorami darczyńców należących do populacji.

Instrukcje

100 XP
  • Utwórz ramkę danych gifts_include zawierającą wszystkie darowizny z 2013 roku lub późniejsze oraz ramkę danych gifts_exclude zawierającą wszystkie darowizny z 2017 roku lub późniejsze.
  • Utwórz zbiór donors_include z identyfikatorami darczyńców z gifts_include oraz zbiór donors_exclude z identyfikatorami darczyńców z gifts_exclude.
  • Skonstruuj populację, używając metody .difference() na dwóch utworzonych zbiorach.