LoslegenKostenlos loslegen

Dask DataFrames aus CSVs erstellen

Zuvor hast du die Spotify-Songdaten mit Schleifen und verzögerten Funktionen analysiert. Jetzt weißt du, dass du dasselbe einfacher mit einem Dask DataFrame erledigen kannst. Lass uns sehen, wie viel leichter die Aufgaben von vorher sind, wenn du sie mit diesen Methoden statt mit Schleifen angehst. Zuerst musst du jedoch den Datensatz in einen Dask DataFrame laden.

Diese Übung ist Teil des Kurses

Parallele Programmierung mit Dask in Python

Kurs anzeigen

Anleitung zur Übung

  • Importiere das Subpaket dask.dataframe als dd.
  • Lies alle CSV-Dateien im Ordner data/spotify mit einer maximalen Blockgröße von 1 MB ein.
  • Verwende die Funktion dd.to_datetime(), um die Strings in der Spalte 'release_date' in Datetime-Objekte umzuwandeln.
  • Verwende die .head()-Methode des DataFrames, um 5 Zeilen der Tabelle anzuzeigen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Import dask dataframe as dd
____

# Load in the DataFrame
df  = ____

# Convert the release_date column from string to datetime
____

# Show 5 rows of the DataFrame
print(____)
Code bearbeiten und ausführen