Cargar múltiples archivos de datos
No pasa nada por importar manualmente varios conjuntos de datos. Sin embargo, habrá ocasiones en las que querrás importar un montón de conjuntos de datos sin tener que hacer varias llamadas a read_csv().
Puedes usar la biblioteca glob, que viene integrada en Python, para buscar archivos que coincidan con un patrón.
La biblioteca se llama «glob» porque «globbing» es la forma en que se especifican patrones en la shell de Bash.
La función glob() devuelve una lista de nombres de archivo que coinciden con un patrón especificado.
Luego puedes usar una comprensión de listas para importar varios archivos en una lista y, a continuación, extraer el DataFrame que te interese.
Este ejercicio forma parte del curso
Python para usuarios de R
Instrucciones del ejercicio
- Obtén una lista de todos los archivos csv en tu directorio actual y asígnala a
csv_files. - Escribe una comprensión de listas que lea todos los archivos
csven una lista,dfs. - Escribe una comprensión de listas que consulte la propiedad
.shapede cada DataFrame de la lista.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
import glob
import pandas as pd
# Get a list of all the csv files
csv_files = glob.____('*.csv')
# List comprehension that loads of all the files
dfs = [pd.read_csv(____) for ____ in ____]
# List comprehension that looks at the shape of all DataFrames
print(____)