Einen Teil einer Tabelle laden
Tabellenkalkulationen, die für Menschen gedacht sind, enthalten oft mehrere Tabellen. Ein kleines Unternehmen könnte z. B. eine Arbeitsmappe zur Lagerverwaltung mit Tabellen für verschiedene Produkttypen auf einem einzigen Blatt führen. Selbst streng tabellarische Daten haben manchmal Kopfzeilen mit Metadaten, wie hier in den New-Developer-Survey-Daten. Diese Metadaten sind nützlich, aber wir wollen sie nicht im DataFrame haben. Du verwendest das Keyword skiprows von read_excel(), um nur die Daten zu laden. Außerdem erstellst du einen String, den du an usecols übergibst, um nur die Spalten AD sowie AW bis BA zu den zukünftigen Berufszielen zu laden.
pandas ist als pd importiert.
Diese Übung ist Teil des Kurses
Vereinfachte Datenaufnahme mit pandas
Anleitung zur Übung
- Erstelle einen einzelnen String
col_string, der angibt, dasspandasdie SpalteADund den BereichAWbisBAladen soll. - Lade
fcc_survey_headers.xlsx'und setzeskiprowssowieusecols, um die ersten zwei Zeilen Metadaten zu überspringen und nur die Spalten incol_stringzu laden. - Lass dir die ausgewählten Spaltennamen im resultierenden DataFrame anzeigen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create string of lettered columns to load
col_string = ____
# Load data with skiprows and usecols set
survey_responses = ____("fcc_survey_headers.xlsx",
____,
____)
# View the names of the columns selected
print(survey_responses.columns)