히스토그램

데이터 세트 loan_data가 작업 공간에 로드되어 있어요. 앞에서는 CrossTable() 함수를 사용해 범주형 변수를 탐색했죠. 이제는 연속형 변수를 탐색해 잠재적인 이상치나 예상 밖의 데이터 구조를 찾으려고 합니다.

이를 위해 hist() 함수를 사용해 서로 다른 고객의 대출 건수 분포를 살펴보며 이해해 봅시다.

hist()를 사용해 인자를 하나만 주고 히스토그램을 그리세요: loan_data$loan_amnt. 결과를 hist_1이라는 새 객체에 할당하세요.
히스토그램 구간 정보를 더 알아보려면 객체 hist_1과 함께 $breaks를 사용하세요. 구간의 위치를 아는 것은 중요해요. 구간을 잘못 정하면 히스토그램이 오해를 부를 수 있기 때문입니다.
breaks 인자를 지정해 hist_1의 구간 수를 200으로 바꾸세요. 추가로, xlab 인자로 x축 이름을 "Loan amount"로 지정하고, main 인자로 제목을 "Histogram of the loan amount"로 지정하세요. 결과를 hist_2에 저장하세요. 봉우리가 해당 위치에 나타나는 이유는 무엇일까요?