1. Apprendre
  2. /
  3. Cours
  4. /
  5. Analyse exploratoire des données en SQL

Connected

Exercice

Des rats !

Les requêtes de la catégorie « Rodents- Rats » prennent en moyenne plus de 64 jours à résoudre. Pourquoi ?

Examinez la question en 4 étapes :

  1. Pourquoi la moyenne est-elle si élevée ? Vérifiez la distribution des délais d'exécution. Indice : date_trunc() peut être utilisé sur des intervalles.

  2. Voyez comment l'exclusion des valeurs aberrantes influence les délais moyens d'exécution.

  3. Les requêtes faites durant les mois achalandés prennent-elles plus de temps à compléter ? Vérifiez la corrélation entre le délai moyen d'exécution et le nombre de requêtes par mois.

  4. Comparez le nombre de requêtes créées par mois et le nombre de requêtes complétées.

Rappel : le temps de résolution, ou délai d'exécution, correspond à date_completed - date_created.

Instructions 1/4

undefined XP
  • 1
    • Utilisez date_trunc() pour examiner la distribution des délais d'exécution des requêtes liées aux rats en nombre de jours.
  • 2
    • Calculez le délai moyen d'exécution par catégorie en excluant les 5 % de requêtes les plus longues (valeurs aberrantes).
  • 3
    • Obtenez corr() entre le délai moyen d'exécution et le nombre mensuel de requêtes. EXTRACT(epoch FROM interval) renvoie le nombre de secondes dans interval.
  • 4
    • Sélectionnez le nombre de requêtes créées et le nombre de requêtes complétées par mois.