テキスト分析で失敗する例

これまでに、テキスト分析の前にストップワードを除去する重要性について学びました。直近の章では、コサイン類似度を使ってテキスト同士の近さを特定する方法を復習しました。

この演習では、テキスト分析を正しく使わないとどうなるかを体験します。ここでは、ストップワードを除去せずに、書籍「Animal Farm」の各章のコサイン類似度を計算します。