ComeçarComece de graça

Um primeiro olhar

Usando o conjunto de dados completo da Avazu, você vai explorar vários novos recursos observando os tipos de dados das colunas. Os novos dados incluem colunas categóricas como site_id, app_id, device_id, etc., que são diferentes identificadores de um determinado site, app e usuário, respectivamente. Para começar, você vai identificar e imprimir as colunas numéricas e categóricas.

Dados de exemplo em formato de DataFrame foram carregados como df. pandas como pd também está disponível no seu ambiente de trabalho.

Este exercício faz parte do curso

Prevendo CTR com Machine Learning em Python

Ver curso

Instruções do exercício

  • Imprima as colunas de df usando .columns.
  • Imprima os tipos de dados correspondentes de df usando .dtypes.
  • Selecione o subconjunto de df com colunas numéricas (usando include = ['int', 'float']) e imprima essas colunas.
  • Selecione o subconjunto de df com colunas categóricas (usando include = ['object']) e imprima essas colunas.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Print columns
print(df.____)

# Print data types of columns
print(df.____)

# Select and print numeric columns
numeric_df = df.____(include=['____', 'float'])
print(numeric_df.____)

# Select and print categorical columns 
categorical_df = df.____(include=['____'])
print(categorical_df.____)
Editar e executar o código