LoslegenKostenlos starten

Unsaubere Daten visualisieren

Schauen wir uns einen neuen Datensatz an – dieser ist etwas weniger sauber als das, was du bisher gesehen hast.

Wie immer beginnst du damit, die Rohdaten zu visualisieren. Sieh dir alles genau an und versuche, Datenpunkte zu finden, die beim Anpassen von Modellen problematisch sein könnten.

Die Daten wurden in ein DataFrame namens prices geladen.

Diese Übung ist Teil des Kurses

<Kurs>Maschinelles Lernen für Zeitreihendaten in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Visualisiere die Zeitreihendaten mit Pandas.
  • Berechne die Anzahl fehlender Werte in jeder Zeitreihe. Notiere dir Unregelmäßigkeiten, die du erkennst. Was könnten sie bedeuten?

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Visualize the dataset
prices.____(legend=False)
plt.tight_layout()
plt.show()

# Count the missing values of each time series
missing_values = prices.____.____
print(missing_values)
Code bearbeiten und ausführen