Datatypes voor kolommen specificeren
Wanneer je gegevens uit een tekst- of CSV-bestand inleest, moet je de namen en datatypes voor elke kolom opgeven. De functie read() probeert te achterhalen of de eerste rij van de gegevensset de kolomnamen bevat. R is slim in het bepalen van sommige datatypes, maar als je een categorische variabele inleest die is gecodeerd als 0, 1 en 2, zal R die als numeriek inlezen. Je moet dan na het inlezen het datatype voor die kolom zelf instellen.
Deze oefening maakt deel uit van de cursus
Multivariate kansverdelingen in R
Oefeninstructies
- Wijs de nieuwe kolomnamen toe aan de
wine-gegevensset en controleer daarna of ze correct zijn ingesteld. - Zet de kolom
Typeom naar een factor met drie niveaus. - Gebruik de functie
str()om het datatype/de structuur te controleren vóór en na het wijzigen van het datatype.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Assign new names
___ <- c('Type', 'Alcohol', 'Malic', 'Ash', 'Alcalinity', 'Magnesium', 'Phenols', 'Flavanoids', 'Nonflavanoids','Proanthocyanins', 'Color', 'Hue', 'Dilution', 'Proline')
# Check the new column names
___
# Check data type/structure of each variable
str(___)
# Change the Type variable data type
___
# Check data type/structure again
___