Unsaubere Daten visualisieren
Schauen wir uns einen neuen Datensatz an – dieser ist etwas weniger sauber als das, was du bisher gesehen hast.
Wie immer beginnst du damit, die Rohdaten zu visualisieren. Sieh dir alles genau an und versuche, Datenpunkte zu finden, die beim Anpassen von Modellen problematisch sein könnten.
Die Daten wurden in ein DataFrame namens prices geladen.
Diese Übung ist Teil des Kurses
Maschinelles Lernen für Zeitreihendaten in Python
Anleitung zur Übung
- Visualisiere die Zeitreihendaten mit Pandas.
- Berechne die Anzahl fehlender Werte in jeder Zeitreihe. Notiere dir Unregelmäßigkeiten, die du erkennst. Was könnten sie bedeuten?
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Visualize the dataset
prices.____(legend=False)
plt.tight_layout()
plt.show()
# Count the missing values of each time series
missing_values = prices.____.____
print(missing_values)