Een vlag maken
Deze keer ga je een echte vlagvariabele maken die 1 geeft wanneer de e-mails een hit hebben op de zoektermen van interesse, en anders 0. Dit is de laatste stap die je nodig hebt om de inhoud van tekstgegevens daadwerkelijk te gebruiken als een feature in een Machine Learning-model, of als een echte vlag bovenop modelresultaten. Je kunt verder werken met de dataframe df met de e-mails, en de searchfor-lijst is degene die in de vorige oefening is gedefinieerd.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in Python
Oefeninstructies
- Gebruik een numpy
where-voorwaarde om een '1' te vlaggen waar de opgeschoonde e-mail woorden bevat uit desearchfor-lijst, en anders 0. - Voeg de woorden in de
searchfor-lijst samen met een "of"-indicator. - Tel de waarden van de nieuw aangemaakte vlagvariabele.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create flag variable where the emails match the searchfor terms
df['flag'] = ____.____((df['clean_content'].___.____('____'.____(____)) == True), 1, 0)
# Count the values of the flag variable
count = df['flag'].____()
print(count)