1. Learn
  2. /
  3. कोर्स
  4. /
  5. SQL में Exploratory Data Analysis

Connected

अभ्यास

मानों को समूहित करें और रीकोड करें

evanston311.category में लगभग 150 अलग-अलग मान हैं. लेकिन इनमें से कुछ कैटेगरी "Main Category - Details" फ़ॉर्म में एक-दूसरे से मिलती-जुलती हैं. अगर हम मुख्य कैटेगरी के आधार पर एग्रीगेट करें, तो हमें सबसे आम रिक्वेस्ट्स का बेहतर अंदाज़ा मिलेगा.

इसे करने के लिए, एक अस्थायी टेबल recode बनाएँ जो अलग-अलग category मानों को नए, standardized मानों से मैप करे. standardized मान वे हों जो डैश ('-') से पहले वाले हिस्से में आते हैं. यह मान split_part() फंक्शन से निकालें:

split_part(string text, delimiter text, field int)

आपको कुछ अतिरिक्त क्लीनअप भी करना होगा, क्योंकि कुछ केस इस पैटर्न में फिट नहीं बैठते.

इसके बाद evanston311 टेबल को recode से जॉइन करके रिक्वेस्ट्स को नए standardized कैटेगरी मानों के आधार पर समूहित किया जा सकता है.

निर्देश 1/4

undefined XP
    1
    2
    3
    4
  • standardized कॉलम सहित recode बनाएँ; split_part() का उपयोग करें और फिर rtrim() से split_part() के परिणाम में बची हुई किसी भी whitespace को हटाएँ.