Trabalhe com várias planilhas
Pastas de trabalho feitas principalmente para leitura por pessoas, não por máquinas, podem armazenar dados sobre um único assunto em várias abas. Por exemplo, um arquivo pode ter uma aba de transações diferente para cada região ou ano em que a empresa operou.
O arquivo FreeCodeCamp New Developer Survey é configurado de forma semelhante, com amostras de respostas de anos diferentes em abas diferentes. Sua tarefa aqui é reuni-las em um único dataframe para análise.
pandas foi importado como pd. Todas as abas foram lidas para o dicionário ordenado responses, em que os nomes das abas são as chaves e os dataframes são os valores, então você pode obter os dataframes com o método values().
Este exercício faz parte do curso
Ingestão de dados simplificada com pandas
Instruções do exercício
- Crie um dataframe vazio,
all_responses. - Configure um loop
forpara iterar pelos valores no dicionárioresponses. - Concatene cada dataframe a
all_responsese reatribua o resultado ao mesmo nome de variável.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create an empty dataframe
all_responses = ____
# Set up for loop to iterate through values in responses
for df in ____:
# Print the number of rows being added
print("Adding {} rows".format(df.shape[0]))
# Concatenate all_responses and df, assign result
all_responses = pd.concat(____)
# Graph employment statuses in sample
counts = all_responses.groupby("EmploymentStatus").EmploymentStatus.count()
counts.plot.barh()
plt.show()