or
Cet exercice fait partie du cours
Dans ce premier chapitre, vous découvrirez le monde de l'ingénierie des données ! Explorez les différences entre un ingénieur de données et un scientifique de données, obtenez un aperçu des divers outils que les ingénieurs de données utilisent et élargissez votre compréhension de la façon dont la technologie du cloud joue un rôle dans l'ingénierie des données.
Maintenant que vous connaissez les principales différences entre un ingénieur des données et un scientifique des données, préparez-vous à explorer la boîte à outils de l'ingénieur des données ! Découvrez en détail les différents types de bases de données utilisées par les ingénieurs en données, comment l'informatique parallèle est une pierre angulaire de la boîte à outils de l'ingénieur en données et comment planifier les tâches de traitement des données à l'aide de cadres de planification.
Après avoir découvert la boîte à outils de l'ingénieur des données, il est temps de passer au pain et au beurre du flux de travail de l'ingénieur des données ! Avec ETL, vous apprendrez à extraire des données brutes de diverses sources, à transformer ces données brutes en informations exploitables et à les charger dans des bases de données pertinentes prêtes à être consommées !
Exercice en cours
Terminez tout ce que vous avez appris dans les trois chapitres précédents en réalisant un cas d'utilisation d'ingénierie des données dans le monde réel à partir de DataCamp ! Vous exécuterez et planifierez un processus ETL qui transforme les données brutes d'évaluation des cours, en recommandations de cours exploitables pour les étudiants de DataCamp !