1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 자연어 처리 입문

Connected

연습 문제

h2o 실습

R에는 여러 Machine Learning 라이브러리가 있습니다. 그중 h2o 라이브러리는 사용하기 쉽고 word2vec 구현을 제공합니다. h2o는 이외에도 다양한 Machine Learning 작업에 사용할 수 있어요. 다만 h2o 라이브러리를 사용하려면 데이터에 대해 추가 전처리 단계가 필요합니다. 여기에는 2016년 미국 대선 운동 기간에 자동으로 트윗된 내용을 담은 left_right라는 데이터셋이 있어요.

다른 텍스트 분석 기법을 위한 준비 대신, 이 데이터셋을 h2o 라이브러리에서 사용할 수 있도록 전처리해 보세요.

지침

100 XP
  • 라이브러리를 임포트하고 h2o 세션을 초기화하세요.
  • h2o 객체를 생성하세요.
  • content 열에 저장된 트윗을 토큰화하세요.
  • 단어를 모두 소문자로 변환하고 불용어를 제거하세요.