LoslegenKostenlos loslegen

Mehrere Datendateien laden

Es ist völlig in Ordnung, mehrere Datensätze manuell zu importieren. Es gibt aber Situationen, in denen du eine Reihe von Datensätzen importieren möchtest, ohne mehrere read_csv()-Aufrufe machen zu müssen. Du kannst dafür die in Python eingebaute Bibliothek glob verwenden, um nach Dateien zu suchen, die zu einem Muster passen. Die Bibliothek heißt „glob“, weil „globbing“ die Art ist, wie Muster in der Bash-Shell angegeben werden.

Die Funktion glob() gibt eine Liste von Dateinamen zurück, die einem bestimmten Muster entsprechen. Du kannst dann eine List Comprehension verwenden, um mehrere Dateien in eine Liste zu laden, und anschließend den DataFrame von Interesse herausziehen.

Diese Übung ist Teil des Kurses

Python für R-Nutzer

Kurs anzeigen

Anleitung zur Übung

  • Erzeuge eine Liste aller CSV-Dateien in deinem aktuellen Verzeichnis und weise sie csv_files zu.
  • Schreibe eine List Comprehension, die alle csv-Dateien in eine Liste dfs einliest.
  • Schreibe eine List Comprehension, die die .shape jedes DataFrames in der Liste ausliest.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

import glob
import pandas as pd

# Get a list of all the csv files
csv_files = glob.____('*.csv')

# List comprehension that loads of all the files
dfs = [pd.read_csv(____) for ____ in ____]

# List comprehension that looks at the shape of all DataFrames
print(____)
Code bearbeiten und ausführen