Listar planilhas em arquivos do Excel
Quer você goste ou não, qualquer cientista de dados que trabalhe precisará de você terá que lidar com planilhas do Excel em algum momento. Você não vai No entanto, você sempre quer fazer isso no Excel!
Aqui, você aprenderá a usar o pandas
para importar planilhas do Excel
e como listar os nomes das planilhas em qualquer arquivo .xlsx carregado.
Você se lembra do vídeo que, dado um arquivo do Excel importado para uma variável
spreadsheet
você pode recuperar uma lista dos nomes das planilhas usando o atributo
spreadsheet.sheet_names
.
Especificamente, você carregará e verificará a planilha
'battledeath.xlsx'
modificado do Peace Research Institute Oslo's (PRIO)
conjunto de dados.
Esses dados contêm taxas de mortalidade ajustadas por idade devido à guerra em vários países durante vários anos.
Este exercício faz parte do curso
Introdução à importação de dados em Python
Instruções de exercício
- Atribua o nome do arquivo da planilha (fornecido acima) à variável
file
. - Passe o argumento correto para
pd.ExcelFile()
para carregar o arquivo usando pandas, atribuindo o resultado à variávelxls
. - Imprima os nomes das planilhas do Excel passando o argumento necessário para a função
print()
.
Exercício interativo prático
Experimente este exercício preenchendo este código de exemplo.
# Import pandas
import pandas as pd
# Assign spreadsheet filename: file
file = ____
# Load spreadsheet: xls
xls = pd.ExcelFile(____)
# Print sheet names
print(____)