Personnalisation de l'importation de votre feuille de calcul
Ici, vous analyserez vos feuilles de calcul et utiliserez des arguments supplémentaires pour sauter des lignes, renommer des colonnes et sélectionner seulement des colonnes particulières.
La feuille de calcul 'battledeath.xlsx' est déjà chargée en tant que
xls.
Comme précédemment, vous utiliserez la méthode parse(). Cette fois-ci, cependant,
vous ajouterez les arguments supplémentaires skiprows, names et
usecols. Ceux-ci sautent des lignes, nomment les colonnes et désignent
les colonnes à analyser, respectivement. Tous ces arguments peuvent
être affectés à des listes contenant les numéros de ligne spécifiques, les chaînes de caractères
et les numéros de colonnes, le cas échéant.
Cet exercice fait partie du cours
Introduction à l'importation de données en Python
Instructions
- Analysez la première feuille en fonction de l'index. Ce faisant, sautez la première ligne de données et nommez les colonnes
'Country'et'AAM due to War (2002)'en utilisant l'argumentnames. Les valeurs transmises àskiprowsetnamesdoivent toutes être de typelist. - Analysez la deuxième feuille en fonction de l'index. Pour ce faire, analysez uniquement la première colonne avec le paramètre
usecols, sautez la première ligne et renommez la colonne'Country'. L'argument transmis àusecolsdoit également être du typelist.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Parse the first sheet and rename the columns: df1
df1 = xls.parse(____, skiprows=____, names=____)
# Print the head of the DataFrame df1
print(df1.head())
# Parse the first column of the second sheet and rename the column: df2
df2 = xls.parse(____, usecols=____, skiprows=____, names=____)
# Print the head of the DataFrame df2
print(df2.head())