1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 배우는 이상치 탐지

Connected

연습 문제

5-수치 요약 출력하기

새로운 데이터를 빠르게 파악하는 가장 손쉬운 방법 중 하나가 5-수치 요약입니다. 이 방법은 분포에 대한 5가지 지표—최솟값, 25퍼센타일, 중앙값, 75퍼센타일, 최댓값—을 평균과 표준편차와 함께 출력해 줍니다. 5-수치 요약과 평균이 최솟값/최댓값과 얼마나 차이 나는지를 살펴보면, 분포에 이상치가 있는지 대략적으로 가늠할 수 있어요.

이번 장의 연습 문제에서는 영상에서 다룬 방법을 사용해 미국 Airbnb 숙소 목록에서 가장 비싼(또는 가장 저렴한) 숙소의 가격을 탐지해 보겠습니다. 데이터셋은 pandas DataFrame인 airbnb_df로 로드되어 있습니다.

지침

100 XP
  • 미국 Airbnb 목록 데이터에서 price 열을 추출해 prices 변수에 저장하세요.
  • prices 분포의 5-수치 요약을 출력하세요.