L'argomento col_names
Oltre a path e sheet, ci sono diversi altri argomenti che puoi specificare in read_excel(). Uno di questi si chiama col_names.
Per impostazione predefinita è TRUE e indica se la prima riga dei fogli Excel contiene i nomi delle colonne. Se non è così, puoi impostare col_names a FALSE. In questo caso, R sceglierà lui i nomi delle colonne. Puoi anche impostare col_names su un vettore di caratteri con i nomi per ciascuna colonna. Funziona esattamente come nel pacchetto readr.
Lavorerai con il file urbanpop_nonames.xlsx (view). Contiene gli stessi dati di urbanpop.xlsx (view) ma non ha i nomi delle colonne nella prima riga dei fogli Excel.
Questo esercizio fa parte del corso
Introduzione all'importazione dei dati in R
Istruzioni dell'esercizio
- Importa il primo foglio Excel di
"urbanpop_nonames.xlsx"e salva il risultato inpop_a. Lascia che sia R a impostare i nomi delle colonne del data frame risultante. - Importa il primo foglio Excel di
urbanpop_nonames.xlsx; questa volta, usa il vettorecolsgià preparato per te per specificare i nomi delle colonne. Salva il data frame risultante inpop_b. - Stampa il riepilogo di
pop_a. - Stampa il riepilogo di
pop_b. Riesci a notare la differenza rispetto all'altro riepilogo?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the first Excel sheet of urbanpop_nonames.xlsx (R gives names): pop_a
pop_a <- read_excel("____", col_names = ____)
# Import the first Excel sheet of urbanpop_nonames.xlsx (specify col_names): pop_b
cols <- c("country", paste0("year_", 1960:1966))
pop_b <- ___
# Print the summary of pop_a
___
# Print the summary of pop_b
___