ComeçarComece de graça

Primeiros passos

Neste exercício, você vai analisar rapidamente um conjunto de dados de exemplo usando operações básicas de DataFrame e dar uma primeira olhada no CTR. Os dados vêm da Avazu, uma importante plataforma global de publicidade, e registram interações de usuários em vários tipos de dispositivos para diferentes sites e apps.

A variável-alvo estará na coluna click. A hora está no formato YYMMDDHH, e há algumas colunas inteiras: device_type para o tipo de dispositivo, banner_pos para a posição de um banner ad (também chamado de display ad), etc. Haverá outras variáveis discutidas nos próximos capítulos.

Os dados de exemplo em formato de DataFrame estão carregados como df. pandas como pd está disponível no seu ambiente.

Este exercício faz parte do curso

Prevendo CTR com Machine Learning em Python

Ver curso

Instruções do exercício

  • Defina a variável X usando .isin(). X deve conter todas as colunas, exceto a coluna click.
  • Defina a variável y, que pode ser acessada usando df.click.
  • Imprima a proporção de linhas de y que são 1 — isso representa o CTR de amostra, usando y.sum().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Look at basics of Dataframe 
print(df.head(5))
print(df.columns)

# Define X and y
X = df.____[:, ~df.columns.____(['click'])]
y = df.____

# Sample CTR
print("Sample CTR :\n", 
      y.____/len(y))
Editar e executar o código