1. Learn
  2. /
  3. คอร์ส
  4. /
  5. การจัดการข้อมูลด้วย dplyr

Connected

แบบฝึกหัด

ใช้ summarize, slice_max, และ count ร่วมกัน

ในบทนี้ คุณได้เรียนรู้การใช้ฟังก์ชันรวมข้อมูล 6 ตัวของ dplyr ได้แก่ count(), group_by(), summarize(), ungroup(), slice_max(), และ slice_min() ในแบบฝึกหัดนี้ จะนำฟังก์ชันเหล่านี้มาใช้ร่วมกันเพื่อตอบคำถามว่า:

มีกี่รัฐที่มีประชากรอาศัยอยู่ในเขตเมืองมากกว่าเขตชนบท?

ขอให้นึกถึงคอลัมน์ metro ซึ่งมีค่าได้ 2 แบบ คือ "Metro" (เขตเมืองที่มีความหนาแน่นสูง) หรือ "Nonmetro" (เขตชานเมืองและชนบท)

counties_selected <- counties %>%
  select(state, metro, population)

คำแนะนำ 1/3

undefined XP
  • 1

    สำหรับทุกการผสมระหว่าง state และ metro ให้หาจำนวนประชากรรวมในชื่อ total_pop

  • 2

    ดึงแถวที่มีประชากรมากที่สุดจากแต่ละรัฐ ซึ่งจะเป็น Metro หรือ Nonmetro

  • 3

    Ungroup ข้อมูล จากนั้นนับความถี่ที่ Metro หรือ Nonmetro ปรากฏ เพื่อดูว่ามีกี่รัฐที่มีประชากรอาศัยอยู่ในแต่ละเขตมากกว่า