or
Cet exercice fait partie du cours
Nous commencerons le cours en définissant la science des données. Nous aborderons le workflow de la science des données et les applications de la science des données à des problèmes concrets. Nous terminerons ce chapitre par la découverte des différents rôles qui existent dans le domaine de la science des données.
Maintenant que nous comprenons le workflow de la science des données, nous allons approfondir la première étape : la collecte et le stockage des données. Nous découvrirons les différentes sources de données dans lesquelles vous pouvez puiser, à quoi ressemblent ces données, comment les stocker une fois qu’elles sont collectées et comment un pipeline de données peut automatiser le processus.
La préparation des données est fondamentale : les scientifiques des données passent 80 % de leur temps à nettoyer et manipuler les données, et seulement 20 % de leur temps à les analyser. Ce chapitre vous montrera comment diagnostiquer les problèmes dans vos données, et comment traiter les valeurs manquantes et les valeurs aberrantes. Vous découvrirez ensuite la visualisation, un autre outil essentiel pour explorer vos données et communiquer vos résultats.
Dans ce dernier chapitre, nous parlerons d’expérimentation et de prédiction ! Nous commencerons par les expériences, puis nous aborderons les tests A/B, et nous passerons aux prévisions de séries temporelles, qui nous apprendront à prédire des événements futurs. Enfin, nous terminerons par le machine learning, et examinerons l’apprentissage supervisé et le clustering.
Exercice en cours