CommencerCommencer gratuitement

Lire de grands entiers

Lors de l’import de très grands jeux de données, il peut être judicieux d’importer les nombres sans décimales en tant qu’entiers, car ils occupent moins d’espace. Les fonctions de base de R (comme read.csv(), read.table(), etc.) le font par défaut lorsque les nombres sont inférieurs à 2^31 - 1 (soit 2147483647). En revanche, les colonnes contenant des nombres supérieurs à cette valeur sont importées par défaut avec le type numeric.

Si le package bit64 est installé, fread() peut importer ces colonnes contenant d’énormes nombres avec le type integer64, implémenté dans le package bit64, par défaut.

Vous allez importer le fichier suivant :

id,name,val
9002019291929192,Robert Whitaker, 200
9200129401349301 ,Elisa Waters,190  
9200149429834456 , Karla Schmidt,458 

Cet exercice fait partie du cours

Manipulation de données avec data.table en R

Afficher le cours

Instructions

  • Importez le fichier sample.csv avec fread() et read.csv().
  • Affichez la classe des colonnes id dans fread_import et base_import.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Import the file using fread 
fread_import <- ___("sample.csv")

# Import the file using read.csv 
base_import <- ___("sample.csv")

# Check the class of id column
___(fread_import$id)
class(base_import$id)
Modifier et exécuter le code