Blätter in Excel-Dateien auflisten
Ob es dir gefällt oder nicht, jeder Data Scientist hat bei seiner Arbeit irgendwann einmal mit Excel-Tabellen zu tun. Allerdings wirst du das nicht immer in Excel tun wollen!
Hier erfährst du, wie du mit pandas
Excel-Tabellen importieren kannst,
und wie du die Namen der Blätter in einer geladenen .xlsx-Datei auflistest.
Rufe dir aus dem Video ins Gedächtnis, dass du eine Excel-Datei, die in eine Variable
spreadsheet
importiert wurde, verwenden kannst, um eine Liste der Blattnamen abzurufen, indem du das Attribut
spreadsheet.sheet_names
nutzt.
Konkret wirst du die Tabelle
'battledeath.xlsx'
laden und ansehen, eine modifizierte Variante des vom Friedensforschungsinstitut Oslo ()
bereitgestellten Datensatzes.
Diese Daten enthalten altersbereinigte Sterberaten aufgrund von Kriegen in verschiedenen Ländern über mehrere Jahre.
Diese Übung ist Teil des Kurses
Einführung in das Importieren von Daten in Python
Anleitung zur Übung
- Weise den Dateinamen der Tabelle (wie oben angegeben) der Variable
file
zu. - Übergib das richtige Argument an
pd.ExcelFile()
, um die Datei mit Pandas zu laden und das Ergebnis der Variablexls
zuzuweisen. - Gib die Blattnamen der Excel-Tabelle aus, indem du der Funktion
print()
das entsprechende Argument übergibst.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Import pandas
import pandas as pd
# Assign spreadsheet filename: file
file = ____
# Load spreadsheet: xls
xls = pd.ExcelFile(____)
# Print sheet names
print(____)