Dask DataFrames aus CSVs erstellen
Zuvor hast du die Spotify-Songdaten mit Schleifen und verzögerten Funktionen analysiert. Jetzt weißt du, dass du dasselbe einfacher mit einem Dask DataFrame erledigen kannst. Lass uns sehen, wie viel leichter die Aufgaben von vorher sind, wenn du sie mit diesen Methoden statt mit Schleifen angehst. Zuerst musst du jedoch den Datensatz in einen Dask DataFrame laden.
Diese Übung ist Teil des Kurses
Parallele Programmierung mit Dask in Python
Anleitung zur Übung
- Importiere das Subpaket
dask.dataframealsdd. - Lies alle CSV-Dateien im Ordner
data/spotifymit einer maximalen Blockgröße von 1 MB ein. - Verwende die Funktion
dd.to_datetime(), um die Strings in der Spalte'release_date'in Datetime-Objekte umzuwandeln. - Verwende die
.head()-Methode des DataFrames, um 5 Zeilen der Tabelle anzuzeigen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import dask dataframe as dd
____
# Load in the DataFrame
df = ____
# Convert the release_date column from string to datetime
____
# Show 5 rows of the DataFrame
print(____)