データ準備

2016年の米国選挙では、ロシアのツイートボットが民主党・共和党の双方に向けて政治的レトリックを継続的に拡散していました。こうしたツイートのデータセット russian_tweets が与えられています。これらのツイートを、左派（民主党）か右派（共和党）かで分類することにしました。分類モデルを構築する前に、モデリングのためにテキストをクリーンアップして準備する必要があります。