1. Learn
  2. /
  3. कोर्स
  4. /
  5. Seaborn के साथ Data Visualization परिचय

Connected

अभ्यास

Outliers हटाना

अब student_data डेटासेट का उपयोग करके उन छात्रों के बीच अंतिम ग्रेड ("G3") के वितरण की तुलना करें जिनके घर पर इंटरनेट है और जिनके पास नहीं है. इसके लिए हम "internet" वैरिएबल का उपयोग करेंगे, जो एक बाइनरी (yes/no) संकेतक है कि छात्र के घर पर इंटरनेट है या नहीं.

क्योंकि ग्रामीण क्षेत्रों में इंटरनेट कम सुलभ हो सकता है, हम छात्र के रहने के स्थान के आधार पर उपसमूह जोड़ेंगे. इसके लिए हम "location" वैरिएबल का उपयोग कर सकते हैं, जो यह दर्शाता है कि छात्र शहरी ("Urban") या ग्रामीण ("Rural") क्षेत्र में रहता है.

Seaborn पहले से sns के रूप में इम्पोर्ट है और matplotlib.pyplot plt के रूप में इम्पोर्ट है. एक याद दिलाने के रूप में, आप बॉक्स प्लॉट्स में आउट्लायर को showfliers=False सेट करके हटा सकते हैं.

निर्देश

100 XP
  • sns.catplot() का उपयोग करके student_data DataFrame से एक बॉक्स प्लॉट बनाएँ, जिसमें x-axis पर "internet" और y-axis पर "G3" हो.
  • उपसमूह जोड़ें ताकि प्रत्येक बॉक्स प्लॉट "location" के आधार पर रंगित हो.
  • आउट्लायर न दिखाएँ.