or
Cet exercice fait partie du cours
Dans ce chapitre, vous allez configurer votre environnement Databricks et explorer l’Airbnb Open Dataset. Vous apprendrez les compétences SQL essentielles pour interroger, filtrer et résumer des données au sein du Databricks Lakehouse. Au travers d’exercices, vous vous entraînerez à simplifier des requêtes complexes avec des sous‑requêtes et à optimiser les performances sur de grands volumes de données grâce à la commande `OPTIMIZE`. Ce chapitre fournit les bases nécessaires pour analyser et gérer efficacement des données dans Databricks.
Dans ce chapitre, vous explorerez des techniques analytiques avancées en utilisant le jeu de données Airbnb dans Databricks SQL Notebooks. À travers des exercices pratiques, vous calculerez des statistiques descriptives et exploiterez des fonctions fenêtre pour des calculs complexes. Vous réaliserez également du feature engineering afin de créer des métriques pertinentes qui génèrent des insights actionnables. À la fin de ce chapitre, vous serez en mesure d’appliquer avec assurance des analyses avancées dans des scénarios de conseil réels pour produire des résultats concrets, en accord avec la stratégie data‑driven de Data X.
La visualisation de données est un puissant levier pour mieux comprendre des jeux de données complexes et communiquer efficacement les principaux enseignements. Dans ce chapitre, vous allez explorer l’art et la méthode pour concevoir des visualisations interactives et construire des tableaux de bord complets avec Databricks. En tirant parti de différents types de graphiques, comme les histogrammes, les cartes thermiques et les cartes géographiques, vous révélerez des distributions, des corrélations et des tendances spatiales. Des filtres interactifs permettront d’explorer dynamiquement les quartiers, les notes de commentaires et les fourchettes de prix.
Exercice en cours