CommencerCommencer gratuitement

Créer une table des réclamations avec primes élevées

Dans cet exercice, vous allez combiner plusieurs tâches d’ingénierie des données pour créer une nouvelle table. C’est une situation typique pour un data engineer : vous devez mobiliser plusieurs concepts d’ingénierie des données pour atteindre votre objectif final. Considérez le scénario suivant :

La vice‑présidente des ajustements de sinistres souhaite mieux comprendre certaines des réclamations les plus importantes reçues par votre entreprise. Pour cette analyse, elle considère qu’une réclamation dont la prime est de 100 $ ou plus est une « réclamation importante ». Elle vous demande de créer une table séparée sur laquelle elle pourra exécuter un rapport répondant aux critères suivants :

  • Afficher le nombre total de clients uniques par identifiant.
  • Ventiler ce nombre par type de couverture d’assurance liée à la réclamation.
  • Limiter l’ensemble de données aux lignes où le montant de la prime est supérieur ou égal à 100 $, en l’utilisant comme proxy pour identifier les réclamations de grande taille.

Cet exercice fait partie du cours

Introduction à Databricks SQL

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice