1. 학습
  2. /
  3. 강의
  4. /
  5. R을 활용한 감성 분석

Connected

연습 문제

2단계: 텍스트 소스 파악하기

이번 연습 문제에서는 보스턴 일대의 숙박 시설 리뷰로 구성된 소규모 코퍼스를 불러와 살펴볼 것입니다. 쉼표로 구분된 파일을 불러올 수 있는 read.csv()는 이미 익숙하실 것입니다. 단순해 보일 수 있지만, 이 챕터의 핵심은 전체 워크플로를 처음부터 끝까지 직접 수행해 보는 것입니다. 데이터 수집부터 시작해 봅시다!

다음으로, str()을 적용하여 데이터 프레임의 구조(structure)를 확인합니다. 이 함수는 벡터의 초기 값과 클래스 유형을 간결하게 출력해 주는 편리한 도구입니다.

마지막으로 dim()을 적용하여 데이터 프레임의 차원(dimensions)을 출력합니다. 데이터 프레임에 사용하면 콘솔에 행 수와 열 수가 표시됩니다.

head(), tail(), summary() 같은 함수들도 데이터 탐색에 자주 활용되지만, 여기서는 간단히 살펴보고 본격적인 감성 분석으로 빠르게 넘어가겠습니다!

지침

100 XP

보스턴 숙박 시설 리뷰는 미리 정의된 변수 bos_reviews_file이 가리키는 CSV 파일에 저장되어 있습니다.

  • read.csv()를 사용하여 bos_reviews_file에서 숙박 시설 리뷰를 불러오세요. 객체 이름은 bos_reviews로 지정합니다.
  • 기본 함수 str()을 bos_reviews에 적용하여 데이터 프레임의 구조를 확인하세요.
  • bos_reviews에 dim()을 호출하여 작업할 리뷰가 몇 개인지 확인하세요.