1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में डेटा क्लीनिंग

Connected

अभ्यास

संगति खोजना

इस अभ्यास में और पूरे अध्याय में, आप airlines DataFrame के साथ काम करेंगे जिसमें एयरलाइन ग्राहकों द्वारा सैन फ़्रांसिस्को एयरपोर्ट पर दिए गए सर्वे के उत्तर हैं.

इस DataFrame में उड़ान से जुड़ा मेटाडेटा है, जैसे एयरलाइन, डेस्टिनेशन, प्रतीक्षा समय, साथ ही स्वच्छता, सुरक्षा और संतुष्टि से जुड़े प्रमुख प्रश्नों के उत्तर. एक और DataFrame categories नाम से बनाया गया है, जिसमें सर्वे कॉलमों के सभी सही संभावित मान शामिल हैं.

इस अभ्यास में, आप इन दोनों DataFrames का इस्तेमाल करके असंगत मानों वाले सर्वे उत्तर ढूँढेंगे और उन्हें हटा देंगे. यह प्रभावी रूप से उस वीडियो अभ्यास में दिखाए गए तरीके के अनुसार इन दोनों DataFrames पर outer और inner join करने जैसा होगा. pandas पैकेज pd के रूप में इम्पोर्ट किया जा चुका है, और airlines तथा categories DataFrames आपके एन्वायरनमेंट में मौजूद हैं.

निर्देश 1/4

undefined XP
    1
    2
    3
    4
  • categories DataFrame प्रिंट करें और सर्वे कॉलमों की सभी संभावित सही कैटेगरी को ध्यान से देखें.
  • .unique() मेथड का उपयोग करके airlines में सर्वे कॉलमों के यूनिक मान प्रिंट करें.