Werkbladen in Excel-bestanden weergeven
Of je het nu leuk vindt of niet, elke data scientist krijgt vroeg of laat te maken met Excel-spreadsheets. Je wilt dat echter niet altijd in Excel zelf doen!
Hier leer je hoe je met pandas Excel-spreadsheets importeert
en hoe je de namen van de werkbladen in een geladen .xlsx-bestand ophaalt.
Herinner je uit de video dat je, als je een Excel-bestand hebt geïmporteerd in een variabele
spreadsheet, een lijst met werkbladnamen kunt opvragen met het attribuut
spreadsheet.sheet_names.
Specifiek ga je het spreadsheet 'battledeath.xlsx' laden en verkennen, aangepast van het
gegevensbestand van het Peace Research Institute Oslo (PRIO).
Deze data bevat leeftijdsgecorrigeerde sterftecijfers door oorlog in verschillende landen over meerdere jaren.
Deze oefening maakt deel uit van de cursus
Introductie tot data importeren in Python
Oefeninstructies
- Ken de bestandsnaam van het spreadsheet (hierboven gegeven) toe aan de variabele
file. - Geef het juiste argument door aan
pd.ExcelFile()om het bestand met pandas te laden, en ken het resultaat toe aan de variabelexls. - Print de werkbladnamen van het Excel-spreadsheet door het benodigde argument aan de functie
print()door te geven.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import pandas
import pandas as pd
# Assign spreadsheet filename: file
file = ____
# Load spreadsheet: xls
xls = pd.ExcelFile(____)
# Print sheet names
print(____)