Busca por palavras com dataframes
Neste exercício, você vai trabalhar com dados de texto contendo emails de funcionários da Enron. O escândalo da Enron é um caso famoso de fraude. Funcionários da Enron mascararam a situação financeira ruim da empresa, mantendo o preço das ações artificialmente alto. Eles venderam suas próprias opções de ações e, quando a verdade veio à tona, os investidores da Enron ficaram sem nada. O objetivo aqui é encontrar todos os emails que mencionam palavras específicas, como "sell enron stock".
Usando operações de string em dataframes, você consegue vasculhar dados de email bagunçados e criar flags com base em ocorrências de palavras. Os dados de emails da Enron foram colocados em um dataframe chamado df, então vamos procurar termos suspeitos. Fique à vontade para explorar o df no Console antes de começar.
Este exercício faz parte do curso
Detecção de Fraudes em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Find all cleaned emails that contain 'sell enron stock'
mask = df['clean_content'].____.____('____', na=False)