Charger des fichiers hébergés
Votre équipe d’ingénierie des données chez Sierra Publishing a exploré différentes fonctionnalités de Databricks pour ses pipelines. L’un de vos data engineers vous a soumis un problème :
En ce moment, je lis plusieurs fichiers CSV depuis un emplacement de data lake externe. Il est très difficile de garder mes tables exactes, car je ne sais jamais quand de nouveaux fichiers arrivent, et je ne me souviens pas facilement quels fichiers j’ai déjà chargés dans mes tables.
Vous souhaitez utiliser une fonctionnalité native de Databricks pour résoudre ce problème. Laquelle des options suivantes vous aiderait ?
Cet exercice fait partie du cours
<cours>Concepts Databricks</cours>Exercice interactif pratique
Transformez la théorie en action avec l’un de nos exercices interactifs
Commencer l’exercice