LoslegenKostenlos starten

Dask DataFrames aus CSVs erstellen

Zuvor hast du die Spotify-Songdaten mit Schleifen und verzögerten Funktionen analysiert. Jetzt weißt du, dass du dasselbe einfacher mit einem Dask DataFrame erledigen kannst. Lass uns sehen, wie viel leichter die Aufgaben von vorher sind, wenn du sie mit diesen Methoden statt mit Schleifen angehst. Zuerst musst du jedoch den Datensatz in einen Dask DataFrame laden.

Diese Übung ist Teil des Kurses

<Kurs>Parallele Programmierung mit Dask in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Importiere das Subpaket dask.dataframe als dd.
  • Lies alle CSV-Dateien im Ordner data/spotify mit einer maximalen Blockgröße von 1 MB ein.
  • Verwende die Funktion dd.to_datetime(), um die Strings in der Spalte 'release_date' in Datetime-Objekte umzuwandeln.
  • Verwende die .head()-Methode des DataFrames, um 5 Zeilen der Tabelle anzuzeigen.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import dask dataframe as dd
____

# Load in the DataFrame
df  = ____

# Convert the release_date column from string to datetime
____

# Show 5 rows of the DataFrame
print(____)
Code bearbeiten und ausführen