1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶ自然言語処理入門

Connected

演習

BoW の例

文献レビューでは、研究者は特定のテーマについて入手可能なテキストをできるだけ多く読み、要約します。その過程で、同じ記事を重複して読んだり、すでに読んだ記事の要約を読んでしまうこともあります。ここでは、原油に関する20本の記事が、Rオブジェクト crude_tibble として与えられています。いきなり記事を1本ずつ読むのではなく、まずはこれらの記事に共通して現れる単語を確認することにしました。そのために、テキストの bag-of-words 表現を作るところから始めます。

指示

100 XP
  • 列 article_id を使って、記事ごとに単語数を数え、BoW 表現を作成してください。
  • 出力を使って、作成された記事/単語の一意な組み合わせがいくつあるかを確認してください。
  • 結果を 'prices' の出現に絞り込んでください。
  • 単語 prices を含む記事はいくつありますか?