1. Learn
  2. /
  3. คอร์ส
  4. /
  5. การแสดงผลข้อมูลด้วย ggplot2 เบื้องต้น

Connected

แบบฝึกหัด

การ Overplot ครั้งที่ 4: ข้อมูลจำนวนเต็ม

มาดูกรณีสุดท้ายของการจัดการกับ overplotting กัน:

  1. ข้อมูลจำนวนเต็ม

ข้อมูลประเภทนี้อาจเป็นแบบ integer (เช่น 1, 2, 3…) หรือแบบ categorical (เช่น คลาส factor) โดย factor เป็นเพียงคลาสพิเศษของ integer

โดยทั่วไปจะมีจุดตัดระหว่างตัวแปรสองตัวในจำนวนน้อยและจำกัด ซึ่งคล้ายกับกรณีที่ 3 แต่อาจมองข้ามได้ง่าย หากไม่ทราบว่าข้อมูลประเภท integer และ factor นั้นมีลักษณะเดียวกับข้อมูลที่มีความแม่นยำต่ำ

ชุดข้อมูล Vocab ที่เตรียมให้นั้นประกอบด้วยจำนวนปีการศึกษาและคะแนนทดสอบคำศัพท์ของผู้ตอบแบบสำรวจ US General Social Surveys ระหว่างปี 1972-2004

คำแนะนำ 1/4

undefined XP
  • 1
    • ตรวจสอบชุดข้อมูล Vocab โดยใช้ str()
    • โดยใช้ Vocab สร้างกราฟของ vocabulary เทียบกับ education
    • เพิ่ม layer จุดข้อมูล
  • 2
    • แทนที่ layer จุดข้อมูลด้วย layer jitter
  • 3
    • กำหนดความโปร่งใสของ jitter เป็น 0.2
  • 4
    • กำหนดรูปร่างของจุด jitter เป็นวงกลมกลวง (shape 1)