Aan de slagGa gratis aan de slag

Een vlag maken

Deze keer ga je een echte vlagvariabele maken die 1 geeft wanneer de e-mails een hit hebben op de zoektermen van interesse, en anders 0. Dit is de laatste stap die je nodig hebt om de inhoud van tekstgegevens daadwerkelijk te gebruiken als een feature in een Machine Learning-model, of als een echte vlag bovenop modelresultaten. Je kunt verder werken met de dataframe df met de e-mails, en de searchfor-lijst is degene die in de vorige oefening is gedefinieerd.

Deze oefening maakt deel uit van de cursus

Fraudedetectie in Python

Cursus bekijken

Oefeninstructies

  • Gebruik een numpy where-voorwaarde om een '1' te vlaggen waar de opgeschoonde e-mail woorden bevat uit de searchfor-lijst, en anders 0.
  • Voeg de woorden in de searchfor-lijst samen met een "of"-indicator.
  • Tel de waarden van de nieuw aangemaakte vlagvariabele.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Create flag variable where the emails match the searchfor terms
df['flag'] = ____.____((df['clean_content'].___.____('____'.____(____)) == True), 1, 0)

# Count the values of the flag variable
count = df['flag'].____()
print(count)
Code bewerken en uitvoeren