Charger des fichiers hébergés
Votre équipe d’ingénierie des données chez Sierra Publishing a exploré différentes fonctionnalités de Databricks pour ses pipelines. L’un de vos data engineers vous a soumis un problème :
En ce moment, je lis plusieurs fichiers CSV depuis un emplacement de data lake externe. Il est très difficile de garder mes tables exactes, car je ne sais jamais quand de nouveaux fichiers arrivent, et je ne me souviens pas facilement quels fichiers j’ai déjà chargés dans mes tables.
Vous souhaitez utiliser une fonctionnalité native de Databricks pour résoudre ce problème. Laquelle des options suivantes vous aiderait ?
Cet exercice fait partie du cours
Concepts Databricks
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice