Je spreadsheetimport aanpassen
Hier ga je je spreadsheets parsen en extra argumenten gebruiken om rijen over te slaan, kolommen te hernoemen en alleen bepaalde kolommen te selecteren.
De spreadsheet 'battledeath.xlsx' is al geladen als
xls.
Net als eerder gebruik je de methode parse(). Deze keer voeg je echter
de extra argumenten skiprows, names en
usecols toe. Deze slaan respectievelijk rijen over, geven kolomnamen en bepalen
welke kolommen je parseert. Al deze argumenten kunnen
worden toegewezen aan lijsten met de betreffende rijnummers, strings
en kolomnummers, afhankelijk van wat nodig is.
Deze oefening maakt deel uit van de cursus
Introductie tot data importeren in Python
Oefeninstructies
- Parse de eerste sheet op index. Sla daarbij de eerste rij met data over en geef de kolommen de namen
'Country'en'AAM due to War (2002)'met het argumentnames. De waarden die je aanskiprowsennamesdoorgeeft, moeten allebei van het typelistzijn. - Parse de tweede sheet op index. Parse daarbij alleen de eerste kolom met de parameter
usecols, sla de eerste rij over en hernoem de kolom naar'Country'. Het argument dat je aanusecolsdoorgeeft, moet ook van het typelistzijn.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Parse the first sheet and rename the columns: df1
df1 = xls.parse(____, skiprows=____, names=____)
# Print the head of the DataFrame df1
print(df1.head())
# Parse the first column of the second sheet and rename the column: df2
df2 = xls.parse(____, usecols=____, skiprows=____, names=____)
# Print the head of the DataFrame df2
print(df2.head())