ComenzarEmpieza gratis

Especificar tipos de datos

Al cargar un archivo plano, pandas infiere el mejor tipo de dato para cada columna. A veces se equivoca, especialmente con números que representan grupos o cualidades en lugar de cantidades.

Si consultas el diccionario de datos de vt_tax_data_2016.csv, verás dos columnas así. La columna agi_stub contiene números que corresponden a categorías de ingresos, y zipcode tiene valores de 5 dígitos que deberían ser cadenas; tratarlos como enteros hace que perdamos los ceros a la izquierda, que sí son significativos. Vamos a especificar los tipos de datos correctos con el argumento dtype.

pandas ya está importado como pd.

Este ejercicio forma parte del curso

Ingesta de datos eficiente con pandas

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Load csv with no additional arguments
data = ____("vt_tax_data_2016.csv")

# Print the data types
print(____)
Editar y ejecutar código