Encontrar variables categóricas
Las variables categóricas son variables que toman un número limitado de valores que describen una categoría. Pueden ser de dos tipos:
- Ordinales: variables con dos o más categorías que se pueden clasificar u ordenar (p. ej., “bajo”, “medio”, “alto”).
- Nominales: variables con dos o más categorías que no tienen un orden intrínseco (p. ej., “hombres”, “mujeres”).
En este ejercicio, vas a identificar las variables categóricas del conjunto de datos. Para ello, primero importa la librería pandas y lee el archivo CSV llamado "turnover.csv". Después, tras ver las primeras 5 filas y comprobar (visualmente) que hay valores no numéricos en el DataFrame, obtén información sobre los tipos de variables disponibles en el conjunto de datos.
Este ejercicio forma parte del curso
Analítica de RR. HH.: Predicción de rotación de empleados en Python
Instrucciones del ejercicio
- Importa
pandas(comopd) para leer los datos. - Lee el archivo
"turnover.csv"y guárdalo en un DataFrame llamadodata. - Echa un vistazo rápido a las primeras 5 filas de datos.
- Obtén información con
info()sobre los tipos de variables en los datos.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import pandas (as pd) to read the data
import ____ as pd
# Read "turnover.csv" and save it in a DataFrame called data
data = pd.____("turnover.csv")
# Take a quick look to the first 5 rows of data
print(data.____())
# Get some information on the types of variables in data
data.____()