1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में डेटा क्लीनिंग

Connected

अभ्यास

श्रेणियों को फिर से मैप करना II

पिछले अभ्यास में, आपने तय किया था कि cuisine_type कॉलम में स्टोर किए गए 'american', 'asian' और 'italian' क्यूज़ीन टाइप्स की टाइपो रीमैपिंग के लिए डिस्टेंस कटऑफ 80 होना चाहिए.

इस अभ्यास में, आप सब कुछ जोड़कर ऐसे मैच ढूँढेंगे जिनके similarity स्कोर 80 के बराबर या उससे अधिक हों। इसके लिए आप fuzywuzzy.process के extract() फंक्शन का इस्तेमाल करेंगे, हर सही क्यूज़ीन टाइप के लिए, और फिर उन मैचों को उसी से रिप्लेस करेंगे। याद रखें, जब आप process.extract() का उपयोग करके किसी string की तुलना strings की array से करते हैं, तो आउटपुट ट्यूपल्स की एक लिस्ट होती है, जहाँ हर ट्यूपल इस तरह फॉर्मेट होता है:

(सबसे नज़दीकी मैच, similarity स्कोर, मैच का इंडेक्स)

आपके वातावरण में restaurants DataFrame मौजूद है, और आपके पास एक categories लिस्ट भी है जिसमें सही क्यूज़ीन टाइप्स हैं ('italian', 'asian', और 'american').

निर्देश 1/4

undefined XP
    1
    2
    3
    4
  • restaurants के cuisine_type कॉलम में मौजूद सभी यूनिक वैल्यूज़ रिटर्न करें.