ComenzarEmpieza gratis

Convirtiendo a DataFrame

Quieres crear un DataFrame a partir de los datos JSON de políticos. Ahora que has desanidado los datos, solo te falta seleccionar las claves que quieres conservar como columnas del DataFrame.

El Dask bag que creaste en el ejercicio anterior está disponible en tu entorno como dict_bag.

Este ejercicio forma parte del curso

Programación paralela con Dask en Python

Ver curso

Instrucciones del ejercicio

  • Completa la función select_keys() para que las claves de la lista keys_to_keep se añadan al nuevo diccionario filtrado y se devuelvan.
  • Usa la función select_keys() para seleccionar las claves ['gender','name', 'birth_date', 'url'] de dict_bag.
  • Convierte el bag filtrado a un Dask DataFrame.
  • Imprime las primeras filas del DataFrame.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

def select_keys(dictionary, keys_to_keep):
  new_dict = {}
  # Loop through kept keys and add them to new dictionary
  for k in ____:
    ____
  return new_dict

# Use the select_keys to reduce to the 4 required keys
filtered_bag = dict_bag.map(____, ____=____)

# Convert the restructured bag to a DataFrame
df = filtered_bag.____

# Print the first few rows of the DataFrame
print(____)
Editar y ejecutar código