Creare un flag
Questa volta andrai a creare una vera e propria variabile flag che assegna 1 quando le email trovano una corrispondenza con i termini di ricerca di interesse, e 0 altrimenti. Questo è l’ultimo passaggio necessario per poter usare il contenuto testuale come feature in un modello di Machine Learning, oppure come flag aggiuntivo sopra i risultati del modello. Puoi continuare a lavorare con il dataframe df che contiene le email; la lista searchfor è quella definita nell’esercizio precedente.
Questo esercizio fa parte del corso
Rilevamento delle frodi in Python
Istruzioni dell'esercizio
- Usa una condizione numpy
whereper segnare "1" quando l’email pulita contiene parole nella listasearchfor, e 0 altrimenti. - Unisci le parole della lista
searchforcon un operatore "or". - Conta i valori della variabile flag appena creata.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create flag variable where the emails match the searchfor terms
df['flag'] = ____.____((df['clean_content'].___.____('____'.____(____)) == True), 1, 0)
# Count the values of the flag variable
count = df['flag'].____()
print(count)