Selecionando tipos de dados específicos
Com frequência, um conjunto de dados contém colunas com vários tipos de dados (como o que você está usando). A maioria dos modelos de Machine Learning exige que você tenha um tipo de dado consistente entre as variáveis. Da mesma forma, a maioria das técnicas de engenharia de atributos se aplica a apenas um tipo de dado por vez. Por esses e outros motivos, você muitas vezes vai querer acessar apenas as colunas de certos tipos ao trabalhar com um DataFrame.
O DataFrame (so_survey_df) do exercício anterior está disponível no seu workspace.
Este exercício faz parte do curso
Feature Engineering for Machine Learning in Python
Instruções do exercício
- Crie um subconjunto de
so_survey_dfcontendo apenas as colunas numéricas (intefloat). - Imprima os nomes das colunas contidas em
so_survey_df_num.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create subset of only the numeric columns
so_numeric_df = so_survey_df.____(____=[____])
# Print the column names contained in so_survey_df_num
print(so_numeric_df.____)