Dictionary naar DataFrame (1)
Pandas is een open-sourcebibliotheek met snelle, gebruiksvriendelijke datastructuren en tools voor data-analyse in Python. Klinkt veelbelovend!
Het DataFrame is een van de belangrijkste datastructuren van Pandas. Het is in feite een manier om tabelgegevens op te slaan, waarbij je de rijen en kolommen kunt labelen. Een manier om een DataFrame te bouwen is vanuit een dictionary.
In de volgende oefeningen werk je met voertuigdata uit verschillende landen. Elke observatie komt overeen met een land en de kolommen geven informatie over het aantal voertuigen per hoofd van de bevolking, of mensen links of rechts rijden, enzovoort.
Er zijn drie lijsten gedefinieerd in het script:
names, met de landnamen waarvoor data beschikbaar is.dr, een lijst met booleans die aangeeft of mensen in het betreffende land links of rechts rijden.cpc, het aantal motorvoertuigen per 1000 inwoners in het betreffende land.
Elke dictionarysleutel is een kolomlabel en elke waarde is een lijst met de elementen van die kolom.
Deze oefening maakt deel uit van de cursus
Python voor gemiddeld niveau
Oefeninstructies
- Importeer
pandasalspd. - Gebruik de vooraf gedefinieerde lijsten om een dictionary
my_dictte maken. Er moeten drie key-valueparen zijn:- key
'country'met valuenames. - key
'drives_right'met valuedr. - key
'cars_per_cap'met valuecpc.
- key
- Gebruik
pd.DataFrame()om je dict om te zetten naar een DataFramecars. - Print
carsen bewonder het resultaat.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Pre-defined lists
names = ['United States', 'Australia', 'Japan', 'India', 'Russia', 'Morocco', 'Egypt']
dr = [True, False, False, False, True, True, True]
cpc = [809, 731, 588, 18, 200, 70, 45]
# Import pandas as pd
# Create dictionary my_dict with three key:value pairs: my_dict
# Build a DataFrame cars from my_dict: cars
# Print cars