1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶNLPの特徴量エンジニアリング

Connected

演習

ロシア語ツイートの文字数カウント

この演習では、FiveThirtyEight がまとめた、ロシアの Internet Research Agency に関連する一部のツイートを含むデータフレーム tweets が与えられています。

あなたのタスクは、各ツイートの文字数を計算する新しい特徴量 'char_count' を tweets に作成することです。あわせて、各ツイートの平均の長さも計算してください。ツイート本文は tweets の content 特徴量に含まれています。

これは実際の Twitter データであり、不適切な表現や不快に感じる内容が含まれる可能性があります(この演習および、同様に実データを使用する以降の演習でも同様です)。

指示

100 XP
  • tweets の 'content' 特徴量に len を適用して、新しい特徴量 char_count を作成します。
  • 'char_count' 特徴量の平均を計算して、ツイートの平均文字数を出力します。