Trabaja con varias hojas de cálculo
Los libros de Excel pensados principalmente para personas, no para máquinas, pueden guardar datos sobre un mismo tema repartidos en varias hojas. Por ejemplo, un archivo puede tener una hoja distinta de transacciones para cada región o año en que operó una empresa.
El archivo FreeCodeCamp New Developer Survey está organizado de forma similar, con muestras de respuestas de distintos años en hojas diferentes. Tu tarea aquí es reunirlas en un único dataframe para analizarlas.
Se ha importado pandas como pd. Todas las hojas se han leído en el diccionario ordenado responses, donde los nombres de las hojas son las claves y los dataframes son los valores, así que puedes obtener los dataframes con el método values().
Este ejercicio forma parte del curso
Ingesta de datos eficiente con pandas
Instrucciones del ejercicio
- Crea un dataframe vacío,
all_responses. - Configura un bucle
forpara iterar por los valores del diccionarioresponses. - Concatena cada dataframe a
all_responsesy reasigna el resultado a la misma variable.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create an empty dataframe
all_responses = ____
# Set up for loop to iterate through values in responses
for df in ____:
# Print the number of rows being added
print("Adding {} rows".format(df.shape[0]))
# Concatenate all_responses and df, assign result
all_responses = pd.concat(____)
# Graph employment statuses in sample
counts = all_responses.groupby("EmploymentStatus").EmploymentStatus.count()
counts.plot.barh()
plt.show()