1. Apprendre
  2. /
  3. Cours
  4. /
  5. Analyse exploratoire des données en SQL

Connected

Exercice

Regrouper et recoder des valeurs

Il existe près de 150 valeurs distinctes de evanston311.category. Mais certaines se ressemblent et suivent la forme « Main Category - Details ». Nous pouvons mieux voir quelles demandes sont les plus courantes si nous agrégeons par la catégorie principale.

Pour ce faire, créez une table temporaire recode qui associe les valeurs distinctes de category à de nouvelles valeurs standardized. Faites en sorte que les valeurs standardized correspondent à la partie de la catégorie avant un trait d'union ('-'). Extrayez cette valeur avec la fonction split_part() :

split_part(string text, delimiter text, field int)

Vous devrez aussi faire un peu de nettoyage additionnel pour quelques cas qui ne suivent pas ce modèle.

Ensuite, la table evanston311 pourra être liée à recode pour regrouper les demandes selon les nouvelles valeurs de catégorie standardized.

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • Créez recode avec une colonne standardized; utilisez split_part() puis rtrim() pour retirer tout espace blanc restant sur le résultat de split_part().