ComeçarComece de graça

Criando um DataFrame para house ads

A equipe de house ads está preocupada porque a taxa de conversão caiu de repente nas últimas semanas. Nos exercícios anteriores, você confirmou que a conversão diminuiu ao notar um padrão relacionado às preferências de idioma.

Como cientista de dados, é seu trabalho fornecer aos stakeholders de marketing um feedback o mais específico possível sobre o que deu errado, para maximizar a capacidade deles de corrigir o problema. É essencial não apenas dizer "parece haver um problema de idioma", mas identificar especificamente qual é o problema para que a equipe não repita o erro.

Este exercício faz parte do curso

Análise de campanhas de marketing com pandas

Ver curso

Instruções do exercício

  • Use np.where() para criar uma nova coluna em house_ads chamada 'is_correct_lang' cujos valores sejam 'Yes' se 'language_displayed' for igual a 'language_preferred' e 'No' caso contrário.
  • Faça um group by em date_served e is_correct_lang para obter a contagem diária dos anúncios exibidos.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Add the new column is_correct_lang
house_ads['is_correct_lang'] = np.____(
    house_ads['____'] == house_ads['____'], 
    '____', 
    '____')

# Groupby date_served and correct_language
language_check = house_ads.____(____)['____'].____()

# Unstack language_check and fill missing values with 0's
language_check_df = pd.DataFrame(language_check.unstack(level=1)).fillna(0)

# Print results
print(language_check_df)
Editar e executar o código