ストップワードとワードクラウド

テキストマイニングの発想に切り替えて、シャルドネ片手に腰を落ち着けたところで、もう少し深掘りしていきます。直前のワードクラウドでは、"chardonnay" が可視化を支配していました。強すぎて、ほかの興味深い示唆が読み取れませんでした。

そこで、ストップワードに "chardonnay" を追加して、他にどんな単語がよく使われているのか、もともと埋もれていた語を見てみましょう。

ワークスペースにはクリーン済みのシャルドネ関連ツイートがありますが、ここでは意味の薄い語をさらに取り除きます。この演習では、比較用に特定のツイートを表示するために content() を使います。コーパスのリストをインデックスするときは、二重角かっこを使うのを忘れないでください。