Listar hojas en archivos Excel
Te guste o no, cualquier científico de datos en activo necesitará tratar con hojas de cálculo Excel en algún momento. No lo harás Sin embargo, ¡siempre querrás hacerlo en Excel!
Aquí aprenderás a utilizar pandas
para importar hojas de cálculo Excel
y cómo listar los nombres de las hojas de cualquier archivo .xlsx cargado.
Recuerda del vídeo que, dado un fichero Excel importado en una variable
spreadsheet
puedes recuperar una lista de los nombres de las hojas utilizando el atributo
spreadsheet.sheet_names
.
Concretamente, cargarás y comprobarás la hoja de cálculo
'battledeath.xlsx'
modificado del Instituto de Investigación para la Paz de Oslo (PRIO)
dataset.
Estos datos contienen las tasas de mortalidad ajustadas por edad debidas a la guerra en varios países a lo largo de varios años.
Este ejercicio forma parte del curso
Introducción a la importación de datos en Python
Instrucciones de ejercicio
- Asigna el nombre de archivo de la hoja de cálculo (proporcionado anteriormente) a la variable
file
. - Pasa el argumento correcto a
pd.ExcelFile()
para cargar el archivo utilizando pandas, asignando el resultado a la variablexls
. - Imprime los nombres de hoja de la hoja de cálculo Excel pasando el argumento necesario a la función
print()
.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Import pandas
import pandas as pd
# Assign spreadsheet filename: file
file = ____
# Load spreadsheet: xls
xls = pd.ExcelFile(____)
# Print sheet names
print(____)