Obtén datos de otros archivos de texto
Aunque los CSV son el tipo de archivo de texto más común, a veces encontrarás archivos con otros delimitadores. read_csv() puede cargar todos ellos con la ayuda del argumento de palabra clave sep. De forma predeterminada, pandas asume que el separador es una coma, por eso no necesitamos especificar sep para los CSV.
La versión de los datos fiscales de Vermont aquí es un archivo de valores separados por tabulaciones (TSV), así que tendrás que usar sep para indicar el delimitador correcto al leer el archivo. Recuerda que las tabulaciones se representan como \t. Una vez cargado el archivo, el resto del código agrupa el campo N1, que contiene categorías de rangos de ingresos, para crear un gráfico de declaraciones de impuestos por categoría de ingresos.
Este ejercicio forma parte del curso
Ingesta de datos eficiente con pandas
Instrucciones del ejercicio
- Importa
pandascon el aliaspd. - Carga
vt_tax_data_2016.tsv, asegurándote de establecer el delimitador correcto con el argumento de palabra clavesep.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import pandas with the alias pd
____
# Load TSV using the sep keyword argument to set delimiter
data = ____(____, ____)
# Plot the total number of tax returns by income group
counts = data.groupby("agi_stub").N1.sum()
counts.plot.bar()
plt.show()