1. 학습
  2. /
  3. 강의
  4. /
  5. pandas로 데이터 다루기

Connected

연습 문제

행 서브셋팅

데이터 과학의 중요한 부분은 데이터셋에서 어떤 부분이 중요한지 찾아내는 일입니다. 가장 간단한 방법 중 하나는 특정 기준에 맞는 행의 부분집합을 찾는 것입니다. 이를 행 필터링 또는 행 선택이라고도 합니다.

DataFrame을 서브셋팅하는 방법은 여럿 있지만, 가장 흔한 방법은 관계 연산자를 사용해 각 행에 대해 True 또는 False를 얻고, 그 결과를 대괄호 안에 넣는 것입니다.

dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]

여러 조건을 동시에 필터링하려면 비트 AND 연산자 &를 사용하면 됩니다.

dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]

homelessness는 이미 준비되어 있고, pandas는 pd로 불러와져 있습니다.

지침 1/3

undefined XP
  • 1

    individuals 수가 만(10,000) 명을 초과하는 경우만 homelessness에서 필터링해 ind_gt_10k에 할당하세요. 출력된 결과를 확인하세요.

  • 2

    미국 인구조사 region이 "Mountain"인 경우만 homelessness에서 필터링해 mountain_reg에 할당하세요. 출력된 결과를 확인하세요.

  • 3

    family_members 수가 천(1,000) 명 미만이고 region이 "Pacific"인 경우만 homelessness에서 필터링해 fam_lt_1k_pac에 할당하세요. 출력된 결과를 확인하세요.