Charger des fichiers hébergés

Votre équipe d’ingénierie des données chez Sierra Publishing a exploré différentes fonctionnalités de Databricks pour ses pipelines. L’un de vos data engineers vous a soumis un problème :

En ce moment, je lis plusieurs fichiers CSV depuis un emplacement de data lake externe. Il est très difficile de garder mes tables exactes, car je ne sais jamais quand de nouveaux fichiers arrivent, et je ne me souviens pas facilement quels fichiers j’ai déjà chargés dans mes tables.

Vous souhaitez utiliser une fonctionnalité native de Databricks pour résoudre ce problème. Laquelle des options suivantes vous aiderait ?

Cet exercice fait partie du cours

<cours>Concepts Databricks</cours>

Voir le cours

Exercice interactif pratique

Transformez la théorie en action avec l’un de nos exercices interactifs

Commencer l’exercice