Anpassen deines Tabellenkalkulationsimports
Hier parst du deine Tabellen und verwendest zusätzliche Argumente zum Überspringen von Zeilen, Umbenennen von Spalten und Auswählen von bestimmten Spalten.
Die Tabelle 'battledeath.xlsx'
ist bereits geladen als
xls
.
Wie bisher verwendest du die Methode parse()
. Doch dieses Mal
fügst du die zusätzlichen Argumente skiprows
, names
und
usecols
hinzu. Diese überspringen die Zeilen, benennen die Spalten und geben an,
welche Spalten geparst werden sollen. All diese Argumente können
Listen zugewiesen werden, die die jeweiligen Zeilennummern, Strings
und ggf. Spaltennummern enthalten.
Diese Übung ist Teil des Kurses
Einführung in das Importieren von Daten in Python
Anleitung zur Übung
- Parse das erste Blatt nach Index. Dabei überspringst du die erste Datenzeile und benennst die Spalten
'Country'
und'AAM due to War (2002)'
mit dem Argumentnames
. Die Werte, die anskiprows
undnames
übergeben werden, müssen alle vom Typlist
sein. - Parse das zweite Blatt nach Index. Dabei analysierst du nur die erste Spalte mit dem Parameter
usecols
, überspringst die erste Zeile und benennst die Spalte'Country'
um. Das Argument, das anusecols
übergeben wird, muss ebenfalls vom Typlist
sein.
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Parse the first sheet and rename the columns: df1
df1 = xls.parse(____, skiprows=____, names=____)
# Print the head of the DataFrame df1
print(df1.head())
# Parse the first column of the second sheet and rename the column: df2
df2 = xls.parse(____, usecols=____, skiprows=____, names=____)
# Print the head of the DataFrame df2
print(df2.head())