Aan de slagGa gratis aan de slag

Datatypes voor kolommen specificeren

Wanneer je gegevens uit een tekst- of CSV-bestand inleest, moet je de namen en datatypes voor elke kolom opgeven. De functie read() probeert te achterhalen of de eerste rij van de gegevensset de kolomnamen bevat. R is slim in het bepalen van sommige datatypes, maar als je een categorische variabele inleest die is gecodeerd als 0, 1 en 2, zal R die als numeriek inlezen. Je moet dan na het inlezen het datatype voor die kolom zelf instellen.

Deze oefening maakt deel uit van de cursus

Multivariate kansverdelingen in R

Cursus bekijken

Oefeninstructies

  • Wijs de nieuwe kolomnamen toe aan de wine-gegevensset en controleer daarna of ze correct zijn ingesteld.
  • Zet de kolom Type om naar een factor met drie niveaus.
  • Gebruik de functie str() om het datatype/de structuur te controleren vóór en na het wijzigen van het datatype.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Assign new names
___ <- c('Type', 'Alcohol', 'Malic', 'Ash', 'Alcalinity', 'Magnesium', 'Phenols', 'Flavanoids', 'Nonflavanoids','Proanthocyanins', 'Color', 'Hue', 'Dilution', 'Proline')
                      
# Check the new column names
___

# Check data type/structure of each variable
str(___)

# Change the Type variable data type
___

# Check data type/structure again 
___
Code bewerken en uitvoeren