Una primera mirada
Usando el conjunto de datos completo de Avazu, vas a explorar varias características nuevas fijándote en los tipos de datos de las columnas. Los datos nuevos incluyen columnas categóricas como site_id, app_id, device_id, etc., que son distintos identificadores de un sitio, una app y un usuario, respectivamente. Para empezar, identificarás e imprimirás las columnas numéricas y las categóricas.
Los datos de ejemplo están cargados en forma de DataFrame como df. pandas como pd también está disponible en tu espacio de trabajo.
Este ejercicio forma parte del curso
Predicción del CTR con Machine Learning en Python
Instrucciones del ejercicio
- Imprime las columnas de
dfusando.columns. - Imprime los tipos de datos correspondientes de
dfusando.dtypes. - Selecciona el subconjunto de
dfcon columnas numéricas (usandoinclude = ['int', 'float']) e imprime esas columnas. - Selecciona el subconjunto de
dfcon columnas categóricas (usandoinclude = ['object']) e imprime esas columnas.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Print columns
print(df.____)
# Print data types of columns
print(df.____)
# Select and print numeric columns
numeric_df = df.____(include=['____', 'float'])
print(numeric_df.____)
# Select and print categorical columns
categorical_df = df.____(include=['____'])
print(categorical_df.____)