1. Learn
  2. /
  3. Courses
  4. /
  5. Python में Statistics परिचय

Connected

Exercise

IQR का उपयोग करके outliers ढूँढना

Outliers का औसत (mean) जैसी statistics पर बड़ा असर पड़ सकता है, और उन statistics पर भी जो mean पर निर्भर करती हैं, जैसे variance और standard deviation. Interquartile range या IQR फैलाव (spread) मापने का एक और तरीका है जिस पर outliers का कम प्रभाव पड़ता है. IQR का उपयोग अक्सर outliers पहचानने के लिए भी किया जाता है. यदि कोई मान \(\text{Q1} - 1.5 \times \text{IQR}\) से कम हो या \(\text{Q3} + 1.5 \times \text{IQR}\) से अधिक हो, तो उसे outlier माना जाता है. वास्तव में, matplotlib के box plot में whiskers की लंबाई इसी तरह निकाली जाती है.

Diagram of a box plot showing median, quartiles, and outliers

इस अभ्यास में, आप IQR की गणना करेंगे और उसका उपयोग करके कुछ outliers ढूँढेंगे. pandas को pd के रूप में और numpy को np के रूप में इम्पोर्ट किया गया है और food_consumption उपलब्ध है.

Instructions 1/4

undefined XP
    1
    2
    3
    4
  • देश के आधार पर group करके और co2_emission का sum लेकर प्रति देश कुल co2_emission की गणना करें. प्राप्त DataFrame को emissions_by_country के रूप में स्टोर करें.