LoslegenKostenlos loslegen

In ein DataFrame umwandeln

Du möchtest aus den JSON-Daten der Politiker:innen ein DataFrame erstellen. Nachdem du die Daten entnestet hast, musst du nur noch die Keys auswählen, die als Spalten im DataFrame behalten werden sollen.

Der Dask Bag, den du in der letzten Übung erstellt hast, steht dir in deiner Umgebung als dict_bag zur Verfügung.

Diese Übung ist Teil des Kurses

Parallele Programmierung mit Dask in Python

Kurs anzeigen

Anleitung zur Übung

  • Vervollständige die Funktion select_keys(), sodass die Keys in der Liste keys_to_keep dem neuen, gefilterten Dictionary hinzugefügt und zurückgegeben werden.
  • Verwende die Funktion select_keys(), um die Keys ['gender','name', 'birth_date', 'url'] aus dict_bag auszuwählen.
  • Wandle den gefilterten Bag in ein Dask DataFrame um.
  • Gib die ersten Zeilen des DataFrames aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

def select_keys(dictionary, keys_to_keep):
  new_dict = {}
  # Loop through kept keys and add them to new dictionary
  for k in ____:
    ____
  return new_dict

# Use the select_keys to reduce to the 4 required keys
filtered_bag = dict_bag.map(____, ____=____)

# Convert the restructured bag to a DataFrame
df = filtered_bag.____

# Print the first few rows of the DataFrame
print(____)
Code bearbeiten und ausführen