Uso di una lista di termini
Spesso non vuoi cercare un solo termine. Probabilmente puoi creare un vero e proprio "dizionario della frode" di termini che potrebbero segnalare clienti e/o transazioni fraudolenti. Gli analisti antifrode di solito hanno un'idea di cosa dovrebbe esserci in un dizionario del genere. In questo esercizio andrai a segnalare una moltitudine di termini e, nel prossimo, creerai una nuova variabile di flag a partire da questi. Il "flag" può essere usato direttamente in un modello di Machine Learning come feature, oppure come filtro aggiuntivo sui risultati del tuo modello di Machine Learning. Cominciamo usando una lista di termini per filtrare i nostri dati. Il dataframe con le email pulite è di nuovo disponibile come df.
Questo esercizio fa parte del corso
Rilevamento delle frodi in Python
Istruzioni dell'esercizio
- Crea una lista di ricerca che includa 'enron stock', 'sell stock', 'stock bonus' e 'sell enron stock'.
- Unisci i termini stringa nelle condizioni di ricerca.
- Filtra i dati usando le email che corrispondono alla lista definita in
searchfor.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a list of terms to search for
searchfor = ['____', '____', '____', '____']
# Filter cleaned emails on searchfor list and select from df
filtered_emails = df.____[____['_____'].____._____('|'.join(____), na=False)]
print(filtered_emails)