Convirtiendo a DataFrame
Quieres crear un DataFrame a partir de los datos JSON de políticos. Ahora que has desanidado los datos, solo te falta seleccionar las claves que quieres conservar como columnas del DataFrame.
El Dask bag que creaste en el ejercicio anterior está disponible en tu entorno como dict_bag.
Este ejercicio forma parte del curso
Programación paralela con Dask en Python
Instrucciones del ejercicio
- Completa la función
select_keys()para que las claves de la listakeys_to_keepse añadan al nuevo diccionario filtrado y se devuelvan. - Usa la función
select_keys()para seleccionar las claves['gender','name', 'birth_date', 'url']dedict_bag. - Convierte el bag filtrado a un Dask DataFrame.
- Imprime las primeras filas del DataFrame.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
def select_keys(dictionary, keys_to_keep):
new_dict = {}
# Loop through kept keys and add them to new dictionary
for k in ____:
____
return new_dict
# Use the select_keys to reduce to the 4 required keys
filtered_bag = dict_bag.map(____, ____=____)
# Convert the restructured bag to a DataFrame
df = filtered_bag.____
# Print the first few rows of the DataFrame
print(____)