1. 학습
  2. /
  3. 프로젝트
  4. /
  5. Python으로 미국 인구조사 데이터 분석하기

Connected

연습 문제

극단값 식별하기

주별 히스패닉 인구의 인종 자기 식별 비율로 구성된 DataFrame을 만들었으니, 이제 seaborn을 사용해 박스플롯부터 그려 보며 더 탐색해 보겠습니다.

또한 특정 인종으로 식별한 히스패닉 비율이 가장 크거나 작은 주를 찾아볼 거예요. 이를 위해 squeeze() 메서드를 사용합니다. 이 메서드는 단일 행 DataFrame을 시리즈로 변환합니다(행이 둘 이상인 DataFrame에는 영향이 없습니다).

pandas는 이미 임포트되어 있습니다. 7개의 서로 다른 인종 범주에 대한 자기 식별 비율을 담은 DataFrame states_hr가 로드되어 있습니다.

지침

100 XP
  • data 매개변수를 DataFrame 이름으로 설정해 박스플롯을 그리세요. (orient = "h"로 설정하면 박스플롯이 가로로 그려집니다.)
  • squeeze를 사용해 hispanic_white 열에서 값이 가장 큰 주를 표시하세요.
  • squeeze를 사용해 hispanic_other 열에서 값이 가장 작은 주를 표시하세요.
  • 아시아인으로 식별하는 히스패닉은 매우 적지만, 한 주는 높은 이상치입니다. squeeze를 사용해 hispanic_asian 열에서 값이 가장 큰 주를 표시하세요.