1. 학습
  2. /
  3. 강의
  4. /
  5. pandas로 데이터 다루기

Connected

연습 문제

효율적인 요약 통계

pandas와 NumPy에는 함수가 아주 많지만, 때로는 데이터를 요약할 때 다른 함수가 필요할 때가 있어요.

.agg() 메서드를 사용하면 DataFrame에 본인이 만든 사용자 지정 함수를 적용할 수 있고, 한 번에 여러 열에 함수를 적용할 수도 있어 집계 작업을 매우 효율적으로 수행할 수 있어요. 예를 들어,

df['column'].agg(function)

이번 연습 문제의 사용자 지정 함수에서 "IQR"은 사분위 범위(inter-quartile range)의 약자로, 75번째 백분위수에서 25번째 백분위수를 뺀 값이에요. 이상치가 있는 데이터에서는 표준편차 대신 유용하게 쓸 수 있는 대안이에요.

sales가 준비되어 있고 pandas는 pd로 불러와져 있어요.

지침 1/3

undefined XP
  • 1
    • 미리 정의된 사용자 지정 함수 iqr과 .agg()를 함께 사용해 sales의 temperature_c 열에 대한 IQR을 출력하세요.
  • 2
    • 열 선택을 업데이트하여 사용자 지정 함수 iqr을 .agg()와 함께 사용해 temperature_c, fuel_price_usd_per_l, unemployment의 IQR을 그 순서대로 출력하세요.
  • 3
    • .agg()가 호출할 집계 함수를 업데이트하세요: iqr와 "median"을 그 순서대로 포함하세요.