1. Învăţa
  2. /
  3. Courses
  4. /
  5. Python으로 하는 Statistical Thinking (파트 1)

Connected

exercise

Iris 데이터의 히스토그램 그리기

이 절의 연습 문제에서는 식물학자 Edward Anderson가 수집하고, 통계학 역사상 가장 영향력 있는 학자 중 한 명인 Ronald Fisher가 널리 알린 고전 데이터 세트를 사용합니다. Anderson는 세 가지 붓꽃 종, Iris setosa, Iris versicolor, Iris virginica의 표본에 대해 해부학적 특성을 정밀하게 측정했습니다. 전체 데이터 세트는 scikit-learn의 일부로 제공됩니다. 여기서는 꽃잎 길이(petal length) 측정값을 다룹니다.

matplotlib/seaborn의 기본 설정으로 Iris versicolor 50개 표본의 꽃잎 길이 히스토그램을 그려 보세요. 기본 seaborn 스타일을 지정하려면 seaborn을 sns로 임포트한 뒤 sns.set()을 사용하면 된다는 점을 기억하세요.

센티미터(cm) 단위의 Iris versicolor 꽃잎 길이만 담은 데이터 하위 집합은 NumPy 배열 versicolor_petal_length에 저장되어 있습니다.

영상에서 Justin은 원하는 열을 추출하기 위해 pandas 라이브러리로 DataFrame을 인덱싱해 히스토그램을 그렸습니다. 하지만 여기서는 제공된 NumPy 배열만 사용하면 됩니다. 또한 Justin은 불필요한 출력이 표시되는 것을 막기 위해(단, plt.show()는 제외) 그리기 구문을 더미 변수 _에 할당했습니다. 이 연습 문제를 푸는 데 필수는 아니지만 좋은 습관입니다. 대안으로, Jupyter 노트북 같은 대화형 환경에서는 그리기 구문 뒤에 ;를 붙여 같은 효과를 낼 수도 있어요. Justin은 _를 선호하므로, 해설 코드에서 이를 보게 될 것입니다.

Instrucţiuni

100 XP
  • matplotlib.pyplot과 seaborn을 각각 일반적인 별칭인 plt, sns로 임포트하세요.
  • seaborn으로 기본 그리기 스타일을 설정하세요.
  • 제공된 NumPy 배열 versicolor_petal_length를 사용해 plt.hist()로 Iris versicolor 꽃잎 길이의 히스토그램을 그리세요.
  • plt.show()로 히스토그램을 표시하세요.