1. Учиться
  2. /
  3. Courses
  4. /
  5. Rで学ぶSentiment Analysis

Connected

Exercise

ステップ2:テキストソースを特定する

この短い演習では、ボストン周辺の物件レンタルに関するレビューの小さなコーパスを読み込み、確認します。カンマ区切りファイルを読み込むための関数である read.csv() は、すでにご存じかもしれません。地味に見えるかもしれませんが、この章のポイントは、はじめから終わりまでの一連のワークフローを実践していただくことです。まずはデータの取り込みから始めましょう!

次に、データフレームの構造(structure)を確認するために str() を適用します。これは、ベクトルの初期値やクラス型をコンパクトに表示してくれる便利な関数です。

最後に、データフレームの次元(dimensions)を出力するために dim() を使います。データフレームの場合、コンソールには行数と列数が表示されます。

データ探索には、ほかにも head()、tail()、summary() などの関数がよく使われますが、今回は確認を手短にして、早速おもしろい感情分析に進みましょう!

Инструкции

100 XP

Boston の物件レンタルレビューは、あらかじめ用意された変数 bos_reviews_file が指す CSV ファイルに保存されています。

  • bos_reviews_file から read.csv() を使ってレビューを読み込み、オブジェクト名を bos_reviews にします。
  • ベース関数の str() を bos_reviews に適用して、データフレームの構造を確認します。
  • dim() を bos_reviews に対して呼び出し、扱っているレビューの件数を把握します。