L’argument skip
Un autre argument très utile lorsque vous lisez des fichiers Excel peu soignés est skip. Avec skip, vous pouvez indiquer à R d’ignorer un certain nombre de lignes dans les feuilles Excel dont vous souhaitez extraire les données. Regardez cet exemple :
read_excel("data.xlsx", skip = 15)
Dans ce cas, les 15 premières lignes de la première feuille de "data.xlsx" sont ignorées.
Si la première ligne de cette feuille contient les noms de colonnes, ces informations seront également ignorées par readxl. Assurez-vous alors de définir col_names sur FALSE ou de spécifier manuellement les noms de colonnes !
Le fichier urbanpop.xlsx (view) est disponible dans votre répertoire ; il contient des noms de colonnes sur les premières lignes.
Cet exercice fait partie du cours
Introduction à l’importation de données dans R
Instructions
- Importez la deuxième feuille de
"urbanpop.xlsx", mais ignorez les 21 premières lignes. Veillez à définircol_names = FALSE. Stockez le data frame obtenu dans une variableurbanpop_sel. - Sélectionnez la première observation de
urbanpop_selet affichez-la.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the second sheet of urbanpop.xlsx, skipping the first 21 rows: urbanpop_sel
urbanpop_sel <- read_excel("urbanpop.xlsx", sheet = ___, col_names =___, skip = ___)
# Print out the first observation from urbanpop_sel
___