Fonctions de Machine Learning
Dans le chapitre précédent, vous avez découvert certaines fonctions de transformation de caractéristiques de Spark MLlib. Si cette bibliothèque était un repas, les transformations de caractéristiques seraient l’entrée ; le plat principal est un large assortiment de fonctions de modélisation de Machine Learning ! Toutes ces fonctions commencent par ml_ et partagent une signature similaire. Elles prennent plusieurs arguments, notamment un tibble, une formule décrivant la relation entre les variables, une chaîne indiquant les features, une chaîne contenant les labels, et d’autres encore.
Parmi les fonctions prises en charge figurent la régression linéaire et ses variantes, les modèles à base d’arbres (ml_decision_tree_classifier()), ainsi que quelques autres. Vous pouvez afficher la liste de toutes les fonctions de Machine Learning avec ls().
ls("package:sparklyr", pattern = "^ml")
Quels arguments toutes les fonctions de modèle de Machine Learning acceptent-elles ?
Cet exercice fait partie du cours
Introduction à Spark avec sparklyr en R
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice