Primeiros passos
Neste exercício, você vai analisar rapidamente um conjunto de dados de exemplo usando operações básicas de DataFrame e dar uma primeira olhada no CTR. Os dados vêm da Avazu, uma importante plataforma global de publicidade, e registram interações de usuários em vários tipos de dispositivos para diferentes sites e apps.
A variável-alvo estará na coluna click. A hora está no formato YYMMDDHH, e há algumas colunas inteiras: device_type para o tipo de dispositivo, banner_pos para a posição de um banner ad (também chamado de display ad), etc. Haverá outras variáveis discutidas nos próximos capítulos.
Os dados de exemplo em formato de DataFrame estão carregados como df. pandas como pd está disponível no seu ambiente.
Este exercicio faz parte do curso
Prevendo CTR com Machine Learning em Python
Instruções do exercicio
- Defina a variável
Xusando.isin().Xdeve conter todas as colunas, exceto a colunaclick. - Defina a variável
y, que pode ser acessada usandodf.click. - Imprima a proporção de linhas de
yque são1— isso representa o CTR de amostra, usandoy.sum().
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Look at basics of Dataframe
print(df.head(5))
print(df.columns)
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____
# Sample CTR
print("Sample CTR :\n",
y.____/len(y))