Een deel van een spreadsheet laden

Spreadsheets die bedoeld zijn om door mensen te worden gelezen, bevatten vaak meerdere tabellen. Zo kan een klein bedrijf een werkmap met inventaris bijhouden met tabellen voor verschillende producttypes op één werkblad. Zelfs tabeldata kan koprijen met metadata hebben, zoals de New Developer Survey-data hier. Die metadata is nuttig, maar we willen die niet in een dataframe. Je gaat de keyword-parameter skiprows van read_excel() gebruiken om alleen de data op te halen. Je maakt ook een string voor usecols om alleen kolommen AD en AW t/m BA te krijgen, over toekomstige loopbaandoelen.

pandas is geïmporteerd als pd.

Deze oefening maakt deel uit van de cursus

Gestroomlijnde data-inname met pandas

Bekijk cursus

Oefeninstructies

Maak één string, col_string, waarin je aangeeft dat pandas kolom AD én het bereik AW t/m BA moet laden.
Laad fcc_survey_headers.xlsx' en stel skiprows en usecols in om de eerste twee rijen met metadata over te slaan en alleen de kolommen in col_string op te halen.
Bekijk de geselecteerde kolomnamen in het resulterende dataframe.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Create string of lettered columns to load
col_string = ____

# Load data with skiprows and usecols set
survey_responses = ____("fcc_survey_headers.xlsx", 
                        ____, 
                        ____)

# View the names of the columns selected
print(survey_responses.columns)

Code bewerken en uitvoeren