or
Cet exercice fait partie du cours
Spark est un framework destiné au traitement du Big Data. Dans ce chapitre, vous découvrirez quelques informations générales sur Spark et le Machine Learning. Vous découvrirez ensuite comment vous connecter à Spark à l'aide de Python et charger des données CSV.
Maintenant que vous savez comment importer des données dans Spark, vous allez passer à la création de deux types de modèles de classification : Arbres de décision et régression logistique. Vous découvrirez également quelques approches de la préparation des données.
Ensuite, vous apprendrez à créer des modèles de régression linéaire. Vous découvrirez également comment enrichir vos données en concevant de nouveaux prédicteurs, ainsi qu'une approche robuste pour sélectionner uniquement les prédicteurs les plus pertinents.
Exercice en cours
Enfin, vous apprendrez comment rendre vos modèles plus efficaces. Vous découvrirez comment utiliser les pipelines pour rendre votre code plus clair et plus facile à maintenir. Ensuite, vous utiliserez la validation croisée pour mieux tester vos modèles et sélectionner les paramètres adéquats. Enfin, vous vous initierez à deux types de modèles d'ensemble.