Especificar tipos de datos
Al cargar un archivo plano, pandas infiere el mejor tipo de dato para cada columna. A veces se equivoca, especialmente con números que representan grupos o cualidades en lugar de cantidades.
Si consultas el diccionario de datos de vt_tax_data_2016.csv, verás dos columnas así. La columna agi_stub contiene números que corresponden a categorías de ingresos, y zipcode tiene valores de 5 dígitos que deberían ser cadenas; tratarlos como enteros hace que perdamos los ceros a la izquierda, que sí son significativos. Vamos a especificar los tipos de datos correctos con el argumento dtype.
pandas ya está importado como pd.
Este ejercicio forma parte del curso
Ingesta de datos eficiente con pandas
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Load csv with no additional arguments
data = ____("vt_tax_data_2016.csv")
# Print the data types
print(____)