1. Learn
  2. /
  3. कोर्स
  4. /
  5. Python में डेटा क्लीनिंग

Connected

अभ्यास

विवरणात्मकता बनाए रखें

San Francisco Airport में यात्रियों के अनुभवों को बेहतर समझने के लिए, क्वालिटी एश्योरेंस विभाग ने उन सभी यात्रियों को एक गुणात्मक प्रश्नावली भेजी जिन्होंने सभी श्रेणियों में हवाईअड्डे को सबसे कम स्कोर दिया था. इस प्रश्नावली का उद्देश्य यह पहचानना है कि यात्री हवाईअड्डे के बारे में क्या कह रहे हैं और उसमें आम पैटर्न क्या हैं.

उनकी प्रतिक्रियाएँ survey_response कॉलम में संग्रहीत हैं. ध्यान से देखने पर, आपने पाया कि कुछ जवाबों में बिना किसी ठोस सामग्री के संभवतः सबसे कम वर्णों की संख्या दी गई थी. इस अभ्यास में, आप उन प्रतिक्रियाओं को अलग करेंगे जिनकी कैरेक्टर काउंट 40 से अधिक है, और assert स्टेटमेंट का उपयोग करके सुनिश्चित करेंगे कि आपके नए DataFrame में 40 या उससे अधिक वर्णों वाली प्रतिक्रियाएँ ही हों.

airlines DataFrame आपके वातावरण में उपलब्ध है, और pandas को pd नाम से इम्पोर्ट किया गया है.

निर्देश

100 XP
  • airlines DataFrame का उपयोग करके, .str.len() से survey_response कॉलम के प्रत्येक इंस्टेंस की लंबाई निकालकर resp_length में स्टोर करें.
  • resp_length जो 40 से अधिक है, ऐसे airlines की पंक्तियाँ अलग करें.
  • यह Assert करें कि airlines_survey में अब survey_response की सबसे छोटी लंबाई 40 से बड़ी है.