Lister les feuilles dans les fichiers Excel
Que vous le vouliez ou non, tout data scientist qui travaille aura affaire à des feuilles de calcul Excel à un moment ou à un autre. Cependant, vous ne voudrez pas toujours le faire dans Excel !
Vous apprendrez ici à utiliser pandas
pour importer des feuilles de calcul Excel
et à lister les noms des feuilles dans un fichier .xlsx chargé.
Rappelez-vous de la vidéo que, étant donné un fichier Excel importé dans une variable
spreadsheet
, vous pouvez récupérer la liste des noms de feuilles en utilisant l’attribut
spreadsheet.sheet_names
.
Plus précisément, vous chargerez et vérifierez la feuille de calcul
'battledeath.xlsx'
, modifiée d'après l’ensemble de données
de l'Institut de recherche sur la paix d'Oslo (PRIO).
Ces données contiennent les taux de mortalité ajustés selon l'âge dus à la guerre dans divers pays au cours de plusieurs années.
Cet exercice fait partie du cours
Introduction à l'importation de données en Python
Instructions
- Affectez le nom du fichier de la feuille de calcul (fourni ci-dessus) à la variable
file
. - Passez l'argument correct à
pd.ExcelFile()
pour charger le fichier à l'aide de pandas, en affectant le résultat à la variablexls
. - Affichez les noms des feuilles du tableur Excel en passant l'argument nécessaire à la fonction
print()
.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import pandas
import pandas as pd
# Assign spreadsheet filename: file
file = ____
# Load spreadsheet: xls
xls = pd.ExcelFile(____)
# Print sheet names
print(____)