LoslegenKostenlos starten

Mehrere Datendateien laden

Es ist völlig in Ordnung, mehrere Datensätze manuell zu importieren. Es gibt aber Situationen, in denen du eine Reihe von Datensätzen importieren möchtest, ohne mehrere read_csv()-Aufrufe machen zu müssen. Du kannst dafür die in Python eingebaute Bibliothek glob verwenden, um nach Dateien zu suchen, die zu einem Muster passen. Die Bibliothek heißt „glob“, weil „globbing“ die Art ist, wie Muster in der Bash-Shell angegeben werden.

Die Funktion glob() gibt eine Liste von Dateinamen zurück, die einem bestimmten Muster entsprechen. Du kannst dann eine List Comprehension verwenden, um mehrere Dateien in eine Liste zu laden, und anschließend den DataFrame von Interesse herausziehen.

Diese Übung ist Teil des Kurses

<Kurs>Python für R-Nutzer</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erzeuge eine Liste aller CSV-Dateien in deinem aktuellen Verzeichnis und weise sie csv_files zu.
  • Schreibe eine List Comprehension, die alle csv-Dateien in eine Liste dfs einliest.
  • Schreibe eine List Comprehension, die die .shape jedes DataFrames in der Liste ausliest.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

import glob
import pandas as pd

# Get a list of all the csv files
csv_files = glob.____('*.csv')

# List comprehension that loads of all the files
dfs = [pd.read_csv(____) for ____ in ____]

# List comprehension that looks at the shape of all DataFrames
print(____)
Code bearbeiten und ausführen