Fehlende Werte mit Pandas auffüllen
Beim Aufbau von Datenpipelines ist es unvermeidlich, dass du über fehlende Daten stolperst. In manchen Fällen möchtest du diese Datensätze vielleicht aus dem Datensatz entfernen. In anderen Fällen musst du die fehlenden Informationen mit Hilfe von Imputationswerten ergänzen. In dieser Übung übst du die Verwendung von pandas
, um fehlende Testergebnisse zu korrigieren.
Die Daten aus der Datei "testing_scores.json"
wurden in einen DataFrame eingelesen und in der Variablen raw_testing_scores
gespeichert. Darüber hinaus wurde pandas
als pd
geladen.
Diese Übung ist Teil des Kurses
ETL und ELT in Python
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Print the head of the `raw_testing_scores` DataFrame
print(raw_testing_scores.____)