Mit mehreren Tabellenblättern arbeiten
Arbeitsmappen, die in erster Linie für Menschen und nicht für Maschinen gedacht sind, speichern Daten zu einem Thema oft über mehrere Tabellenblätter hinweg. Eine Datei kann zum Beispiel für jede Region oder jedes Jahr, in dem ein Unternehmen tätig war, ein eigenes Blatt mit Transaktionen haben.
Die FreeCodeCamp New Developer Survey ist ähnlich aufgebaut, mit Antwortstichproben aus verschiedenen Jahren in unterschiedlichen Blättern. Deine Aufgabe ist es, sie für die Analyse in einem DataFrame zusammenzuführen.
pandas wurde als pd importiert. Alle Blätter wurden in das geordnete Dictionary responses eingelesen, bei dem die Blattnamen die Schlüssel und die DataFrames die Werte sind. Du kannst die DataFrames also mit der Methode values() abrufen.
Diese Übung ist Teil des Kurses
Vereinfachte Datenaufnahme mit pandas
Anleitung zur Übung
- Erstelle ein leeres DataFrame
all_responses. - Richte eine
for-Schleife ein, um über die Werte im Dictionaryresponseszu iterieren. - Hänge jedes DataFrame an
all_responsesan und weise das Ergebnis wieder derselben Variablen zu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create an empty dataframe
all_responses = ____
# Set up for loop to iterate through values in responses
for df in ____:
# Print the number of rows being added
print("Adding {} rows".format(df.shape[0]))
# Concatenate all_responses and df, assign result
all_responses = pd.concat(____)
# Graph employment statuses in sample
counts = all_responses.groupby("EmploymentStatus").EmploymentStatus.count()
counts.plot.barh()
plt.show()