Aan de slagGa gratis aan de slag

Werkbladen in Excel-bestanden weergeven

Of je het nu leuk vindt of niet, elke data scientist krijgt vroeg of laat te maken met Excel-spreadsheets. Je wilt dat echter niet altijd in Excel zelf doen!

Hier leer je hoe je met pandas Excel-spreadsheets importeert en hoe je de namen van de werkbladen in een geladen .xlsx-bestand ophaalt.

Herinner je uit de video dat je, als je een Excel-bestand hebt geïmporteerd in een variabele spreadsheet, een lijst met werkbladnamen kunt opvragen met het attribuut spreadsheet.sheet_names.

Specifiek ga je het spreadsheet 'battledeath.xlsx' laden en verkennen, aangepast van het gegevensbestand van het Peace Research Institute Oslo (PRIO). Deze data bevat leeftijdsgecorrigeerde sterftecijfers door oorlog in verschillende landen over meerdere jaren.

Deze oefening maakt deel uit van de cursus

Introductie tot data importeren in Python

Cursus bekijken

Oefeninstructies

  • Ken de bestandsnaam van het spreadsheet (hierboven gegeven) toe aan de variabele file.
  • Geef het juiste argument door aan pd.ExcelFile() om het bestand met pandas te laden, en ken het resultaat toe aan de variabele xls.
  • Print de werkbladnamen van het Excel-spreadsheet door het benodigde argument aan de functie print() door te geven.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import pandas
import pandas as pd

# Assign spreadsheet filename: file
file = ____

# Load spreadsheet: xls
xls = pd.ExcelFile(____)

# Print sheet names
print(____)
Code bewerken en uitvoeren