ComeçarComece de graça

Usando lista de termos

Muitas vezes, você não quer buscar apenas um termo. É provável que você consiga criar um “dicionário de fraude” com termos que podem sinalizar clientes e/ou transações fraudulentas. Analistas de fraude geralmente têm uma boa ideia do que deve entrar nesse dicionário. Neste exercício, você vai sinalizar vários termos e, no próximo, vai criar uma nova variável de flag a partir disso. Essa flag pode ser usada diretamente como feature em um modelo de Machine Learning, ou como um filtro adicional sobre os resultados do seu modelo de Machine Learning. Vamos primeiro usar uma lista de termos para filtrar nossos dados. O dataframe com os e-mails limpos está disponível novamente como df.

Este exercício faz parte do curso

Detecção de Fraudes em Python

Ver curso

Instruções do exercício

  • Crie uma lista para busca incluindo 'enron stock', 'sell stock', 'stock bonus' e 'sell enron stock'.
  • Una as strings dos termos nas condições de busca.
  • Filtre os dados usando os e-mails que corresponderem à lista definida em searchfor.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a list of terms to search for
searchfor = ['____', '____', '____', '____']

# Filter cleaned emails on searchfor list and select from df 
filtered_emails = df.____[____['_____'].____._____('|'.join(____), na=False)]
print(filtered_emails)
Editar e executar o código