Uso di una lista di termini

Spesso non vuoi cercare un solo termine. Probabilmente puoi creare un vero e proprio "dizionario della frode" di termini che potrebbero segnalare clienti e/o transazioni fraudolenti. Gli analisti antifrode di solito hanno un'idea di cosa dovrebbe esserci in un dizionario del genere. In questo esercizio andrai a segnalare una moltitudine di termini e, nel prossimo, creerai una nuova variabile di flag a partire da questi. Il "flag" può essere usato direttamente in un modello di Machine Learning come feature, oppure come filtro aggiuntivo sui risultati del tuo modello di Machine Learning. Cominciamo usando una lista di termini per filtrare i nostri dati. Il dataframe con le email pulite è di nuovo disponibile come df.

Questo esercizio fa parte del corso

Rilevamento delle frodi in Python

Visualizza corso

Istruzioni dell'esercizio

Crea una lista di ricerca che includa 'enron stock', 'sell stock', 'stock bonus' e 'sell enron stock'.
Unisci i termini stringa nelle condizioni di ricerca.
Filtra i dati usando le email che corrispondono alla lista definita in searchfor.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a list of terms to search for
searchfor = ['____', '____', '____', '____']

# Filter cleaned emails on searchfor list and select from df 
filtered_emails = df.____[____['_____'].____._____('|'.join(____), na=False)]
print(filtered_emails)

Modifica ed esegui il codice