Einen Teil einer Tabelle laden

Tabellenkalkulationen, die für Menschen gedacht sind, enthalten oft mehrere Tabellen. Ein kleines Unternehmen könnte z. B. eine Arbeitsmappe zur Lagerverwaltung mit Tabellen für verschiedene Produkttypen auf einem einzigen Blatt führen. Selbst streng tabellarische Daten haben manchmal Kopfzeilen mit Metadaten, wie hier in den New-Developer-Survey-Daten. Diese Metadaten sind nützlich, aber wir wollen sie nicht im DataFrame haben. Du verwendest das Keyword skiprows von read_excel(), um nur die Daten zu laden. Außerdem erstellst du einen String, den du an usecols übergibst, um nur die Spalten AD sowie AW bis BA zu den zukünftigen Berufszielen zu laden.

pandas ist als pd importiert.

Diese Übung ist Teil des Kurses

<Kurs>Vereinfachte Datenaufnahme mit pandas</Kurs>

Kurs ansehen

Übungsanweisungen

Erstelle einen einzelnen String col_string, der angibt, dass pandas die Spalte AD und den Bereich AW bis BA laden soll.
Lade fcc_survey_headers.xlsx' und setze skiprows sowie usecols, um die ersten zwei Zeilen Metadaten zu überspringen und nur die Spalten in col_string zu laden.
Lass dir die ausgewählten Spaltennamen im resultierenden DataFrame anzeigen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create string of lettered columns to load
col_string = ____

# Load data with skiprows and usecols set
survey_responses = ____("fcc_survey_headers.xlsx", 
                        ____, 
                        ____)

# View the names of the columns selected
print(survey_responses.columns)

Code bearbeiten und ausführen