IniziaInizia gratis

Conversione in DataFrame

Vuoi creare un DataFrame a partire dai dati JSON dei politici. Ora che hai eliminato i livelli annidati, ti basta selezionare le chiavi da mantenere come colonne del DataFrame.

Il Dask bag che hai creato nell'esercizio precedente è disponibile nel tuo ambiente come dict_bag.

Questo esercizio fa parte del corso

Programmazione parallela con Dask in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Completa la funzione select_keys() in modo che le chiavi nella lista keys_to_keep vengano aggiunte al nuovo dizionario filtrato e restituite.
  • Usa la funzione select_keys() per selezionare le chiavi ['gender','name', 'birth_date', 'url'] da dict_bag.
  • Converte il bag filtrato in un Dask DataFrame.
  • Stampa le prime righe del DataFrame.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

def select_keys(dictionary, keys_to_keep):
  new_dict = {}
  # Loop through kept keys and add them to new dictionary
  for k in ____:
    ____
  return new_dict

# Use the select_keys to reduce to the 4 required keys
filtered_bag = dict_bag.map(____, ____=____)

# Convert the restructured bag to a DataFrame
df = filtered_bag.____

# Print the first few rows of the DataFrame
print(____)
Modifica ed esegui il codice