Primeiros passos
Neste exercício, você vai analisar rapidamente um conjunto de dados de exemplo usando operações básicas de DataFrame e dar uma primeira olhada no CTR. Os dados vêm da Avazu, uma importante plataforma global de publicidade, e registram interações de usuários em vários tipos de dispositivos para diferentes sites e apps.
A variável-alvo estará na coluna click. A hora está no formato YYMMDDHH, e há algumas colunas inteiras: device_type para o tipo de dispositivo, banner_pos para a posição de um banner ad (também chamado de display ad), etc. Haverá outras variáveis discutidas nos próximos capítulos.
Os dados de exemplo em formato de DataFrame estão carregados como df. pandas como pd está disponível no seu ambiente.
Este exercício faz parte do curso
Prevendo CTR com Machine Learning em Python
Instruções do exercício
- Defina a variável
Xusando.isin().Xdeve conter todas as colunas, exceto a colunaclick. - Defina a variável
y, que pode ser acessada usandodf.click. - Imprima a proporção de linhas de
yque são1— isso representa o CTR de amostra, usandoy.sum().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Look at basics of Dataframe
print(df.head(5))
print(df.columns)
# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____
# Sample CTR
print("Sample CTR :\n",
y.____/len(y))