Um primeiro olhar
Usando o conjunto de dados completo da Avazu, você vai explorar vários novos recursos observando os tipos de dados das colunas. Os novos dados incluem colunas categóricas como site_id, app_id, device_id, etc., que são diferentes identificadores de um determinado site, app e usuário, respectivamente. Para começar, você vai identificar e imprimir as colunas numéricas e categóricas.
Dados de exemplo em formato de DataFrame foram carregados como df. pandas como pd também está disponível no seu ambiente de trabalho.
Este exercício faz parte do curso
Prevendo CTR com Machine Learning em Python
Instruções do exercício
- Imprima as colunas de
dfusando.columns. - Imprima os tipos de dados correspondentes de
dfusando.dtypes. - Selecione o subconjunto de
dfcom colunas numéricas (usandoinclude = ['int', 'float']) e imprima essas colunas. - Selecione o subconjunto de
dfcom colunas categóricas (usandoinclude = ['object']) e imprima essas colunas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Print columns
print(df.____)
# Print data types of columns
print(df.____)
# Select and print numeric columns
numeric_df = df.____(include=['____', 'float'])
print(numeric_df.____)
# Select and print categorical columns
categorical_df = df.____(include=['____'])
print(categorical_df.____)