Lister les feuilles dans les fichiers Excel
Que vous le vouliez ou non, tout data scientist qui travaille aura affaire à des feuilles de calcul Excel à un moment ou à un autre. Cependant, vous ne voudrez pas toujours le faire dans Excel !
Vous apprendrez ici à utiliser pandas pour importer des feuilles de calcul Excel
et à lister les noms des feuilles dans un fichier .xlsx chargé.
Rappelez-vous de la vidéo que, étant donné un fichier Excel importé dans une variable
spreadsheet, vous pouvez récupérer la liste des noms de feuilles en utilisant l’attribut
spreadsheet.sheet_names.
Plus précisément, vous chargerez et vérifierez la feuille de calcul
'battledeath.xlsx', modifiée d'après l’ensemble de données
de l'Institut de recherche sur la paix d'Oslo (PRIO).
Ces données contiennent les taux de mortalité ajustés selon l'âge dus à la guerre dans divers pays au cours de plusieurs années.
Cet exercice fait partie du cours
Introduction à l'importation de données en Python
Instructions
- Affectez le nom du fichier de la feuille de calcul (fourni ci-dessus) à la variable
file. - Passez l'argument correct à
pd.ExcelFile()pour charger le fichier à l'aide de pandas, en affectant le résultat à la variablexls. - Affichez les noms des feuilles du tableur Excel en passant l'argument nécessaire à la fonction
print().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import pandas
import pandas as pd
# Assign spreadsheet filename: file
file = ____
# Load spreadsheet: xls
xls = pd.ExcelFile(____)
# Print sheet names
print(____)