Grote gehele getallen inlezen
Bij het importeren van enorme gegevenssets kan het handig zijn om getallen zonder decimalen als integers te importeren, omdat integers minder ruimte innemen. Basisfuncties in R (zoals read.csv(), read.table(), enz.) doen dit standaard wanneer de getallen kleiner zijn dan 2^31 - 1 (of 2147483647). Kolommen met grotere getallen worden echter standaard geïmporteerd als type numeric.
Als het pakket bit64 is geïnstalleerd, kan fread() deze kolommen met zeer grote getallen standaard importeren als type integer64, dat is geïmplementeerd in het bit64-pakket.
Je gaat het volgende bestand importeren:
id,name,val
9002019291929192,Robert Whitaker, 200
9200129401349301 ,Elisa Waters,190
9200149429834456 , Karla Schmidt,458
Deze oefening maakt deel uit van de cursus
Gegevens manipuleren met data.table in R
Oefeninstructies
- Importeer het bestand
sample.csvmetfread()enread.csv(). - Print de klasse van de kolom
idinfread_importenbase_import.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the file using fread
fread_import <- ___("sample.csv")
# Import the file using read.csv
base_import <- ___("sample.csv")
# Check the class of id column
___(fread_import$id)
class(base_import$id)