Listagem de planilhas em arquivos do Excel
Quer você goste ou não, todo cientista de dados precisará lidar com planilhas Excel em algum momento. Mas nem sempre você vai querer fazer isso no Excel!
Aqui, você aprenderá a usar pandas para importar planilhas do Excel
e como listar os nomes das planilhas em qualquer arquivo .xlsx carregado.
Você se lembra do vídeo que, dado um arquivo do Excel importado para uma variável
spreadsheetvocê pode recuperar uma lista dos nomes das planilhas usando o atributo
spreadsheet.sheet_names.
Especificamente, você carregará e verificará a planilha
'battledeath.xlsx', adaptado do Instituto de Pesquisa para a Paz de Oslo (PRIO)
conjunto de dados.
Esses dados contêm taxas de mortalidade ajustadas por idade devido à guerra em vários países durante vários anos.
Este exercício faz parte do curso
Introdução à importação de dados em Python
Instruções do exercício
- Atribua o nome do arquivo da planilha (fornecido acima) à variável
file. - Passe o argumento correto para
pd.ExcelFile()para carregar o arquivo usando pandas, atribuindo o resultado à variávelxls. - Imprima os nomes das planilhas do Excel passando o argumento necessário para a função
print().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Import pandas
import pandas as pd
# Assign spreadsheet filename: file
file = ____
# Load spreadsheet: xls
xls = pd.ExcelFile(____)
# Print sheet names
print(____)