1. Learn
  2. /
  3. Courses
  4. /
  5. Rで学ぶ自然言語処理入門

Connected

Exercise

h2o の練習

R にはいくつかの Machine Learning ライブラリがありますが、h2o は使いやすく、word2vec の実装も提供しています。h2o は他のさまざまな Machine Learning タスクにも利用できます。ただし、h2o ライブラリを使うには、データに対して追加の前処理が必要です。ここでは、2016年の米国選挙キャンペーン中に自動ツイートされた投稿を含む left_right というデータセットがあります。

他のテキスト分析手法向けにデータを整えるのではなく、h2o ライブラリで使えるようにこのデータセットを準備してください。

Instructions

100 XP
  • ライブラリをインポートし、h2o セッションを初期化します。
  • h2o オブジェクトを作成します。
  • content 列に保存されているツイートをトークン化します。
  • 単語をすべて小文字に変換し、ストップワードをすべて除去します。