Lire de grands entiers
Lors de l’import de très grands jeux de données, il peut être judicieux d’importer les nombres sans décimales en tant qu’entiers, car ils occupent moins d’espace. Les fonctions de base de R (comme read.csv(), read.table(), etc.) le font par défaut lorsque les nombres sont inférieurs à 2^31 - 1 (soit 2147483647). En revanche, les colonnes contenant des nombres supérieurs à cette valeur sont importées par défaut avec le type numeric.
Si le package bit64 est installé, fread() peut importer ces colonnes contenant d’énormes nombres avec le type integer64, implémenté dans le package bit64, par défaut.
Vous allez importer le fichier suivant :
id,name,val
9002019291929192,Robert Whitaker, 200
9200129401349301 ,Elisa Waters,190
9200149429834456 , Karla Schmidt,458
Cet exercice fait partie du cours
Manipulation de données avec data.table en R
Instructions
- Importez le fichier
sample.csvavecfread()etread.csv(). - Affichez la classe des colonnes
iddansfread_importetbase_import.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Import the file using fread
fread_import <- ___("sample.csv")
# Import the file using read.csv
base_import <- ___("sample.csv")
# Check the class of id column
___(fread_import$id)
class(base_import$id)