1. 학습
  2. /
  3. 강의
  4. /
  5. pandas를 이용한 데이터 다루기

Connected

연습 문제

효율적으로 요약하기

pandas와 NumPy에는 다양한 함수가 있지만, 때로는 데이터를 요약하기 위해 또 다른 함수가 필요하기도 합니다.

.agg() 메서드를 사용하면 DataFrame에 사용자 정의 함수를 적용하거나, DataFrame의 여러 열에 함수를 한 번에 적용할 수 있어 매우 효율적인 집계 처리가 가능합니다. 예를 들어보겠습니다.

df['column'].agg(function)

이 연습 문제의 사용자 정의 함수에서 "IQR"은 사분위수 범위의 약자로, 75백분위수에서 25백분위수를 뺀 값입니다. 데이터에 이상치가 포함된 경우 표준편차의 대안으로 활용됩니다.

sales를 사용할 수 있으며, pandas는 pd라는 별칭으로 사용할 수 있습니다.

지침 1/3

undefined XP
  • 1
    • 미리 정의된 맞춤형 함수 iqr을 .agg()와 함께 사용해서 sales의 temperature_c 열에 대한 IQR을 출력하세요.
  • 2
    • 열 선택 범위를 업데이트하여 맞춤형 함수 iqr을 .agg()와 함께 사용해 temperature_c, fuel_price_usd_per_l, unemployment의 IQR을 순서대로 출력하세요.
  • 3
    • .agg()가 호출하는 집계 함수를 업데이트하여 iqr과 "median"을 순서대로 포함하세요.