Opérations repliables (II)
Vous allez maintenant utiliser la fonction sur des partitions du jeu de données. En réalisant cette opération par morceaux puis en agrégeant, vous n’avez pas besoin d’avoir toutes les données en mémoire en même temps. Ce point n’est pas crucial avec de petits jeux de données, comme l’échantillon de prêts hypothécaires, mais il l’est pour les grands volumes de données.
Cet exercice fait partie du cours
Traitement de données à grande échelle en R
Instructions
La fonction foldable_range() est disponible dans votre espace de travail.
- Scindez les lignes de
mortselon la colonne"year". - Utilisez
foldable_range()pour obtenir l’étendue de la colonne"record_number"par blocs, regroupés par année.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Split the mortgage data by year
spl <- ___
# Use foldable_range() to get the range of the record numbers
foldable_range(___(function(s) ___(mort[s, "record_number"]), ___))