Conversione in DataFrame
Vuoi creare un DataFrame a partire dai dati JSON dei politici. Ora che hai eliminato i livelli annidati, ti basta selezionare le chiavi da mantenere come colonne del DataFrame.
Il Dask bag che hai creato nell'esercizio precedente è disponibile nel tuo ambiente come dict_bag.
Questo esercizio fa parte del corso
Programmazione parallela con Dask in Python
Istruzioni dell'esercizio
- Completa la funzione
select_keys()in modo che le chiavi nella listakeys_to_keepvengano aggiunte al nuovo dizionario filtrato e restituite. - Usa la funzione
select_keys()per selezionare le chiavi['gender','name', 'birth_date', 'url']dadict_bag. - Converte il bag filtrato in un Dask DataFrame.
- Stampa le prime righe del DataFrame.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
def select_keys(dictionary, keys_to_keep):
new_dict = {}
# Loop through kept keys and add them to new dictionary
for k in ____:
____
return new_dict
# Use the select_keys to reduce to the 4 required keys
filtered_bag = dict_bag.map(____, ____=____)
# Convert the restructured bag to a DataFrame
df = filtered_bag.____
# Print the first few rows of the DataFrame
print(____)