Cet exercice fait partie du cours
Dans ce chapitre, vous découvrirez les problèmes de classification et apprendrez à les résoudre à l'aide de techniques d'apprentissage supervisé. Vous apprendrez à diviser les données en ensembles d'apprentissage et de test, à adapter un modèle, à faire des prédictions et à évaluer la précision. Vous découvrirez la relation entre la complexité du modèle et la performance, en appliquant ce que vous avez appris à un ensemble de données sur le taux de perte de clients, où vous classerez l'état de désabonnement des clients d'une entreprise de télécommunications.
Dans ce chapitre, vous découvrirez la régression et vous construirez des modèles pour prédire les valeurs des ventes à l'aide d'un ensemble de données sur les dépenses publicitaires. Vous apprendrez les mécanismes de la régression linéaire et les mesures de performance courantes telles que le R au carré et l'erreur quadratique moyenne. Vous effectuerez une validation croisée k-fold et appliquerez une régularisation aux modèles de régression afin de réduire le risque de surapprentissage.
Après avoir entraîné des modèles, vous allez maintenant apprendre à les évaluer. Dans ce chapitre, vous découvrirez plusieurs métriques ainsi qu'une technique de visualisation permettant d'analyser les performances des modèles de classification utilisant scikit-learn. Vous apprendrez également à optimiser les modèles de classification et de régression grâce à l'ajustement des hyperparamètres.
Apprenez à imputer les valeurs manquantes, à convertir les données catégorielles en valeurs numériques, à mettre à l'échelle les données, à évaluer simultanément plusieurs modèles d'apprentissage supervisé et à créer des pipelines pour rationaliser votre flux de travail.
Exercice en cours