Una popolazione conforme alla timeline
Supponi di voler costruire una base table per un modello predittivo che stimi se i donatori faranno una donazione nel 2018. La timeline indica che la popolazione deve contenere tutti i donatori che hanno donato almeno una volta dal 1° gennaio 2013, ma non hanno effettuato donazioni dopo il 1° gennaio 2017.
Ti viene fornito un dataframe pandas gifts con tutte le donazioni effettuate dal 2010. In questo esercizio, costruirai un insieme con gli ID dei donatori di tutti i donatori nella popolazione.
Questo esercizio fa parte del corso
Analisi predittiva intermedia in Python
Istruzioni dell'esercizio
- Crea un dataframe
gifts_includecontenente tutte le donazioni effettuate nel 2013 o successivamente e un dataframegifts_excludecontenente tutte le donazioni effettuate nel 2017 o successivamente. - Crea un insieme
donors_includecontenente tutti gli ID dei donatori presenti ingifts_includee un insiemedonors_excludecontenente tutti gli ID dei donatori presenti ingifts_exclude. - Costruisci la popolazione usando il metodo
.difference()sui due insiemi.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Gifts made in 2013 or later
gifts_include = ____[____[____].dt.year >= ____]
# Gifts made in 2017 or later
gifts_exclude = ____[____[____].dt.year >= ____]
# Set with ids in gifts_include
donors_include = ____(____[____])
# Set with ids in gifts_exclude
donors_exclude = ____(____[____])
# Population
population = ____.difference(____)
print(len(population))