Caricare più file di dati
Va benissimo importare manualmente più insiemi di dati. Tuttavia, a volte vorrai importarne diversi senza dover chiamare read_csv() più volte.
Puoi usare la libreria glob, inclusa in Python, per cercare file che corrispondono a un determinato pattern.
La libreria si chiama "glob" perché il "globbing" è il modo in cui si specificano i pattern nella shell Bash.
La funzione glob() restituisce un elenco di nomi di file che corrispondono a un pattern specificato.
Puoi quindi usare una list comprehension per importare più file in una lista e, a quel punto, estrarre il DataFrame che ti interessa.
Questo esercizio fa parte del corso
Python per utenti R
Istruzioni dell'esercizio
- Ottieni l'elenco di tutti i file csv nella directory corrente e assegnalo a
csv_files. - Scrivi una list comprehension che legga tutti i file
csvin una lista,dfs. - Scrivi una list comprehension che esamini la
.shapedi ogni DataFrame nella lista.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
import glob
import pandas as pd
# Get a list of all the csv files
csv_files = glob.____('*.csv')
# List comprehension that loads of all the files
dfs = [pd.read_csv(____) for ____ in ____]
# List comprehension that looks at the shape of all DataFrames
print(____)