Von CSV zum DataFrame (1)
Es ist zwar möglich, Daten in einem Dictionary zu sammeln und daraus einen DataFrame zu erstellen, aber besonders effizient ist das nicht. Stell dir vor, du hast es mit Millionen von Beobachtungen zu tun! In solchen Fällen liegen die Daten normalerweise in Dateien mit einer regelmäßigen Struktur vor. Ein typisches Beispiel für solche Dateitypen ist das CSV-Format. Die Abkürzung CSV steht für „comma-separated values“ – die Werte werden also jeweils durch ein Komma getrennt.
Um CSV Daten als Pandas DataFrame in Python zu importieren, kannst du read_csv()
verwenden.
Wir testen diese Funktion jetzt mit denselben Fahrzeugdaten aus der vorigen Übung. Diesmal liegen die Daten jedoch in einer CSV-Datei namens cars.csv
vor. Sie ist in deinem aktuellen Arbeitsverzeichnis verfügbar, also einfach über den Pfad 'cars.csv'
.
Diese Übung ist Teil des Kurses
Python für Fortgeschrittene
Anleitung zur Übung
- Um CSV-Dateien zu importieren, brauchst du noch das Paket
pandas
. Importiere es alspd
. - Verwende
pd.read_csv()
, umcars.csv
Daten als DataFrame zu importieren. Speichere diesen DataFrame alscars
. - Gib
cars
aus. Sieht alles wie erwartet aus?
Interaktive Übung zum Anfassen
Probieren Sie diese Übung aus, indem Sie diesen Beispielcode ausführen.
# Import pandas as pd
# Import the cars.csv data: cars
# Print out cars