Het argument skip
Een ander argument dat erg handig kan zijn bij het inlezen van minder nette Excel-bestanden is skip. Met skip kun je R vertellen om een opgegeven aantal rijen in de Excel-sheets waarvan je data wilt halen, over te slaan. Kijk eens naar dit voorbeeld:
read_excel("data.xlsx", skip = 15)
In dit geval worden de eerste 15 rijen in het eerste werkblad van "data.xlsx" overgeslagen.
Als de eerste rij van dit werkblad de kolomnamen bevat, wordt die informatie ook genegeerd door readxl. Zorg er in dat geval voor dat je col_names op FALSE zet of geef de kolomnamen handmatig op!
Het bestand urbanpop.xlsx (view) is beschikbaar in je map; het heeft kolomnamen in de eerste rijen.
Deze oefening maakt deel uit van de cursus
Introductie tot het importeren van data in R
Oefeninstructies
- Importeer het tweede werkblad van
"urbanpop.xlsx", maar sla de eerste 21 rijen over. Zorg ervoor dat jecol_names = FALSEzet. Sla het resulterende data frame op in een variabeleurbanpop_sel. - Selecteer de eerste observatie uit
urbanpop_selen print deze.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the second sheet of urbanpop.xlsx, skipping the first 21 rows: urbanpop_sel
urbanpop_sel <- read_excel("urbanpop.xlsx", sheet = ___, col_names =___, skip = ___)
# Print out the first observation from urbanpop_sel
___