ComeçarComece de graça

Busca por palavras com dataframes

Neste exercício, você vai trabalhar com dados de texto contendo emails de funcionários da Enron. O escândalo da Enron é um caso famoso de fraude. Funcionários da Enron mascararam a situação financeira ruim da empresa, mantendo o preço das ações artificialmente alto. Eles venderam suas próprias opções de ações e, quando a verdade veio à tona, os investidores da Enron ficaram sem nada. O objetivo aqui é encontrar todos os emails que mencionam palavras específicas, como "sell enron stock".

Usando operações de string em dataframes, você consegue vasculhar dados de email bagunçados e criar flags com base em ocorrências de palavras. Os dados de emails da Enron foram colocados em um dataframe chamado df, então vamos procurar termos suspeitos. Fique à vontade para explorar o df no Console antes de começar.

Este exercício faz parte do curso

Detecção de Fraudes em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Find all cleaned emails that contain 'sell enron stock'
mask = df['clean_content'].____.____('____', na=False)
Editar e executar o código