Het argument col_names
Naast path en sheet kun je in read_excel() nog verschillende andere argumenten opgeven. Een van deze argumenten is col_names.
Standaard staat dit op TRUE, wat aangeeft of de eerste rij in de Excel-werkbladen de kolomnamen bevat. Als dat niet zo is, kun je col_names op FALSE zetten. In dat geval kiest R zelf kolomnamen voor je. Je kunt col_names ook instellen op een tekenvector met namen voor elke kolom. Dit werkt precies hetzelfde als in het readr-pakket.
Je gaat werken met het bestand urbanpop_nonames.xlsx (bekijken). Het bevat dezelfde gegevens als urbanpop.xlsx (bekijken), maar heeft geen kolomnamen in de eerste rij van de Excel-werkbladen.
Deze oefening maakt deel uit van de cursus
Introductie tot het importeren van data in R
Oefeninstructies
- Importeer het eerste Excel-werkblad van
"urbanpop_nonames.xlsx"en sla het resultaat op inpop_a. Laat R zelf de kolomnamen van het resulterende data frame instellen. - Importeer het eerste Excel-werkblad van
urbanpop_nonames.xlsx; gebruik deze keer de vectorcolsdie al voor je is klaargezet om de kolomnamen op te geven. Sla het resulterende data frame op inpop_b. - Print de samenvatting van
pop_a. - Print de samenvatting van
pop_b. Zie je het verschil met de andere samenvatting?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the first Excel sheet of urbanpop_nonames.xlsx (R gives names): pop_a
pop_a <- read_excel("____", col_names = ____)
# Import the first Excel sheet of urbanpop_nonames.xlsx (specify col_names): pop_b
cols <- c("country", paste0("year_", 1960:1966))
pop_b <- ___
# Print the summary of pop_a
___
# Print the summary of pop_b
___