Blätter in Excel-Dateien auflisten
Ob es dir gefällt oder nicht, jeder Data Scientist hat bei seiner Arbeit irgendwann einmal mit Excel-Tabellen zu tun. Allerdings wirst du das nicht immer in Excel tun wollen!
Hier erfährst du, wie du mit pandas Excel-Tabellen importieren kannst,
und wie du die Namen der Blätter in einer geladenen .xlsx-Datei auflistest.
Im Video wurde gesagt, dass du eine Excel-Datei, die in eine Variable
spreadsheet importiert wurde, verwenden kannst, um eine Liste der Blattnamen abzurufen, indem du das Attribut
spreadsheet.sheet_names nutzt.
Konkret wirst du die Tabelle
'battledeath.xlsx' laden und ansehen, eine modifizierte Variante des vom Friedensforschungsinstitut Oslo ()
bereitgestellten Datensatzes.
Diese Daten enthalten altersbereinigte Sterberaten aufgrund von Kriegen in verschiedenen Ländern über mehrere Jahre.
Diese Übung ist Teil des Kurses
<Kurs>Einführung in das Importieren von Daten in Python</Kurs>Übungsanweisungen
- Weise den Dateinamen der Tabelle (wie oben angegeben) der Variable
filezu. - Übergib das richtige Argument an
pd.ExcelFile(), um die Datei mit pandas zu laden und das Ergebnis der Variablexlszuzuweisen. - Gib die Blattnamen der Excel-Tabelle aus, indem du der Funktion
print()das entsprechende Argument übergibst.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import pandas
import pandas as pd
# Assign spreadsheet filename: file
file = ____
# Load spreadsheet: xls
xls = pd.ExcelFile(____)
# Print sheet names
print(____)