L’argument col_names
Outre path et sheet, vous pouvez renseigner plusieurs autres arguments dans read_excel(). L’un d’eux s’appelle col_names.
Par défaut, sa valeur est TRUE : elle indique si la première ligne des feuilles Excel contient les noms de colonnes. Si ce n’est pas le cas, vous pouvez définir col_names sur FALSE. Dans ce cas, R choisira des noms de colonnes pour vous. Vous pouvez aussi définir col_names comme un vecteur de caractères contenant un nom pour chaque colonne. Cela fonctionne exactement comme dans le package readr.
Vous allez travailler avec le fichier urbanpop_nonames.xlsx (view). Il contient les mêmes données que urbanpop.xlsx (view), mais sans noms de colonnes en première ligne des feuilles Excel.
Cet exercice fait partie du cours
Introduction à l’importation de données dans R
Instructions
- Importez la première feuille Excel de
"urbanpop_nonames.xlsx"et stockez le résultat danspop_a. Laissez R définir lui‑même les noms de colonnes du data frame obtenu. - Importez la première feuille Excel de
urbanpop_nonames.xlsx; cette fois, utilisez le vecteurcolsdéjà préparé pour vous pour spécifier les noms de colonnes. Stockez le data frame obtenu danspop_b. - Affichez le résumé de
pop_a. - Affichez le résumé de
pop_b. Voyez-vous la différence avec l’autre résumé ?
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the first Excel sheet of urbanpop_nonames.xlsx (R gives names): pop_a
pop_a <- read_excel("____", col_names = ____)
# Import the first Excel sheet of urbanpop_nonames.xlsx (specify col_names): pop_b
cols <- c("country", paste0("year_", 1960:1966))
pop_b <- ___
# Print the summary of pop_a
___
# Print the summary of pop_b
___