1. Learn
  2. /
  3. 课程
  4. /
  5. ggplot2 के साथ डेटा विज़ुअलाइज़ेशन परिचय

Connected

道练习

ओवरप्लॉटिंग 1: बड़े डेटासेट

स्कैटर प्लॉट (geom_point()) सहज, आसानी से समझ में आने वाले, और बहुत सामान्य होते हैं, लेकिन हमें ओवरप्लॉटिंग को हमेशा ध्यान में रखना चाहिए, खासकर इन चार स्थितियों में:

  1. बड़े डेटासेट
  2. एक ही अक्ष पर संरेखित मान
  3. कम-सटीकता वाला डेटा
  4. पूर्णांक (integer) डेटा

आम तौर पर, ठोस शेप्स के साथ alpha ब्लेंडिंग (यानी ट्रांसपेरेंसी जोड़ना) की सिफारिश की जाती है। वैकल्पिक रूप से, आप अपारदर्शी, खोखले शेप्स का उपयोग कर सकते हैं।

उच्च घनत्व वाले क्षेत्रों (बहुत अधिक ओवरलैप) के साथ बड़े डेटासेट के लिए छोटे पॉइंट उपयुक्त होते हैं।

आइए बड़े डेटासेट वाले मामले से निपटने का अभ्यास करने के लिए diamonds डेटासेट का उपयोग करें।

说明 1/2

undefined XP
  • 1

    बेस प्लॉट में एक पॉइंट लेयर जोड़ें।

    • पॉइंट की ट्रांसपेरेंसी 0.5 पर सेट करें।
    • shape = "." सेट करें, जो 1 पिक्सेल के पॉइंट साइज के बराबर है।
  • 2

    लाइन आउटलाइन हटाने के लिए shape को 16 पर सेट करके पॉइंट शेप अपडेट करें।