1. Nauka
  2. /
  3. Kursy
  4. /
  5. Pośrednia analityka predykcyjna w Pythonie

Connected

ćwiczenie

Oblicz zagregowany target

Załóż, że chcesz zbudować model predykcyjny wskazujący, którzy darczyńcy z największym prawdopodobieństwem przekażą darowiznę przekraczającą 50 euro w danym miesiącu.

Dana jest tabela bazowa basetable, która zawiera już po jednym wierszu dla każdego darczyńcy w populacji. Kolumna donor_id reprezentuje darczyńcę. Zgodnie z osią czasu, target powinien przyjąć wartość 1, jeśli darczyńca przekazał ponad 50 euro w styczniu 2017 roku, a 0 w przeciwnym razie.

Ramka danych pandas gifts_201701 zawiera wszystkie darowizny ze stycznia 2017 roku. W tym ćwiczeniu dodasz kolumnę z targetem do tabeli bazowej.

Instrukcje

100 XP
  • Utwórz gifts_summed zawierający dla każdego darczyńcy z gifts_201701 sumę jego darowizn.
  • Na podstawie gifts_summed wyznacz listę targets z darczyńcami, którzy w okresie docelowym przekazali ponad 50 euro.
  • Dodaj kolumnę z targetem do tabeli bazowej.
  • Oblicz i wyświetl częstość występowania targetu.