Aan de slagBegin gratis

Een vlag maken

Deze keer ga je een echte vlagvariabele maken die 1 geeft wanneer de e-mails een hit hebben op de zoektermen van interesse, en anders 0. Dit is de laatste stap die je nodig hebt om de inhoud van tekstgegevens daadwerkelijk te gebruiken als een feature in een Machine Learning-model, of als een echte vlag bovenop modelresultaten. Je kunt verder werken met de dataframe df met de e-mails, en de searchfor-lijst is degene die in de vorige oefening is gedefinieerd.

Deze oefening maakt deel uit van de cursus

Fraudedetectie in Python

Bekijk cursus

Oefeninstructies

  • Gebruik een numpy where-voorwaarde om een '1' te vlaggen waar de opgeschoonde e-mail woorden bevat uit de searchfor-lijst, en anders 0.
  • Voeg de woorden in de searchfor-lijst samen met een "of"-indicator.
  • Tel de waarden van de nieuw aangemaakte vlagvariabele.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create flag variable where the emails match the searchfor terms
df['flag'] = ____.____((df['clean_content'].___.____('____'.____(____)) == True), 1, 0)

# Count the values of the flag variable
count = df['flag'].____()
print(count)
Code bewerken en uitvoeren