ComeçarComece de graça

Carregar vários arquivos de dados

Não há problema em importar vários conjuntos de dados manualmente. Porém, em alguns casos você vai querer importar um monte de conjuntos de dados sem precisar fazer várias chamadas a read_csv(). Você pode usar a biblioteca glob, que já vem com o Python, para buscar arquivos que correspondam a um padrão. A biblioteca se chama "glob" porque "globbing" é o modo como padrões são especificados no shell Bash.

A função glob() retorna uma lista de nomes de arquivo que correspondem a um padrão específico. Depois, você pode usar uma compreensão de lista para importar vários arquivos para uma lista e, em seguida, extrair o DataFrame de interesse.

Este exercício faz parte do curso

Python para usuários de R

Ver curso

Instruções do exercício

  • Obtenha uma lista de todos os arquivos csv no seu diretório atual e atribua a csv_files.
  • Escreva uma compreensão de lista que leia todos os arquivos csv em uma lista, dfs.
  • Escreva uma compreensão de lista que verifique o .shape de cada DataFrame na lista.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

import glob
import pandas as pd

# Get a list of all the csv files
csv_files = glob.____('*.csv')

# List comprehension that loads of all the files
dfs = [pd.read_csv(____) for ____ in ____]

# List comprehension that looks at the shape of all DataFrames
print(____)
Editar e executar o código