ComenzarEmpieza gratis

Obtén datos de otros archivos de texto

Aunque los CSV son el tipo de archivo de texto más común, a veces encontrarás archivos con otros delimitadores. read_csv() puede cargar todos ellos con la ayuda del argumento de palabra clave sep. De forma predeterminada, pandas asume que el separador es una coma, por eso no necesitamos especificar sep para los CSV.

La versión de los datos fiscales de Vermont aquí es un archivo de valores separados por tabulaciones (TSV), así que tendrás que usar sep para indicar el delimitador correcto al leer el archivo. Recuerda que las tabulaciones se representan como \t. Una vez cargado el archivo, el resto del código agrupa el campo N1, que contiene categorías de rangos de ingresos, para crear un gráfico de declaraciones de impuestos por categoría de ingresos.

Este ejercicio forma parte del curso

Ingesta de datos eficiente con pandas

Ver curso

Instrucciones del ejercicio

  • Importa pandas con el alias pd.
  • Carga vt_tax_data_2016.tsv, asegurándote de establecer el delimitador correcto con el argumento de palabra clave sep.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Import pandas with the alias pd
____

# Load TSV using the sep keyword argument to set delimiter
data = ____(____, ____)

# Plot the total number of tax returns by income group
counts = data.groupby("agi_stub").N1.sum()
counts.plot.bar()
plt.show()
Editar y ejecutar código