1. Learn
  2. /
  3. คอร์ส
  4. /
  5. การแสดงผลข้อมูลด้วย ggplot2 เบื้องต้น

Connected

แบบฝึกหัด

Overplotting 1: ชุดข้อมูลขนาดใหญ่

Scatter plot (ใช้ geom_point()) เป็น geometry ที่ใช้งานง่าย เข้าใจได้ทันที และได้รับความนิยมมาก แต่ต้องระวังปัญหา overplotting เสมอ โดยเฉพาะในสถานการณ์ต่อไปนี้

  1. ชุดข้อมูลขนาดใหญ่
  2. ค่าที่เรียงตัวอยู่บนแกนเดียวกัน
  3. ข้อมูลที่มีความละเอียดต่ำ
  4. ข้อมูลประเภทจำนวนเต็ม

โดยทั่วไป แนะนำให้ใช้การปรับ alpha (คือการเพิ่มความโปร่งใส) เมื่อใช้รูปทรงทึบ หรืออาจเลือกใช้รูปทรงกลวงแบบทึบแสงแทน

จุดขนาดเล็กเหมาะสำหรับชุดข้อมูลขนาดใหญ่ที่มีบริเวณที่มีความหนาแน่นสูง (จุดซ้อนทับกันมาก)

มาฝึกรับมือกับกรณีชุดข้อมูลขนาดใหญ่โดยใช้ชุดข้อมูล diamonds กัน

คำแนะนำ 1/2

undefined XP
  • 1

    เพิ่ม layer ของจุดลงในกราฟพื้นฐาน

    • กำหนดความโปร่งใสของจุดเป็น 0.5
    • กำหนด shape = "." ซึ่งเป็นขนาดจุด 1 พิกเซล
  • 2

    อัปเดต shape ของจุดเพื่อลบเส้นขอบออก โดยกำหนด shape เป็น 16