1. Learn
  2. /
  3. Courses
  4. /
  5. Python で学ぶ Natural Language Processing 入門

Connected

Exercise

モデルを改善する

この演習では、Tfidf ベクトルを使って複数の alpha の値を試し、より良い組み合わせがないかを確かめます。

学習用・テスト用データセットは用意済みで、tfidf_vectorizer、tfidf_train、tfidf_test も計算済みです。

Instructions

100 XP
  • np.arange() を使って試す alpha のリストを作成します。値は 0 から 1 まで、刻み幅は 0.1 にします。
  • train_and_predict() という関数を作成し、引数は alpha を1つだけ取ります。関数は次を行います。
    • alpha=alpha として MultinomialNB 分類器を生成する。
    • 学習用データにフィットする。
    • テストデータで予測を行う。
    • 正解率を計算して返す。
  • for ループを使い、alpha、score を表示し、その間に改行を入れます。score の計算には train_and_predict() 関数を使います。alpha とともにスコアは変化しますか。最適な alpha はどれですか。