1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶSentiment Analysis

Connected

演習

ステップ3:分類器を構築する

これが感情分析による予測の最終ステップです。これまでに、感情に関連する特徴量でデータセットを探索・拡張し、数値ベクトルを作成してきました。

前のステップで作成したデータセットを使います。具体的には、レビューの長さを表す特徴量と、Tfidf ベクトライザで作成した200個の特徴量が含まれています。

あなたの課題は、感情を予測するためにロジスティック回帰を学習させることです。データはすでに読み込まれており、reviews_transformed と呼ばれます。目的変数は score で、二値です:製品レビューがポジティブなときは 1、それ以外は 0 です。

ロジスティック回帰モデルを学習し、テストデータで性能を評価してください。モデルの出来はどうでしょうか?

必要なパッケージはすべてインポート済みです。

指示

100 XP
  • 学習/テスト分割を実行し、データの20%をテスト用に割り当て、乱数シードを 456 に設定してください。
  • ロジスティック回帰モデルを学習してください。
  • クラスを予測してください。
  • テストセットにおける正解率と混同行列を出力してください。