1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rで学ぶSupport Vector Machines

Connected

演習

砂糖含有量データセットの可視化

この演習では、清涼飲料水の砂糖含有量25件の測定値を、1次元の散布図として作成します。目的は、データセット内の明確なクラスタを可視化し、候補となる識別境界を見つける第一歩にすることです。

25件の砂糖含有量測定値は、データフレーム df の sugar_content 列に保存されています。df はあらかじめ読み込まれています。

指示

100 XP
  • ggplot2 パッケージを読み込みます。
  • データフレーム df の変数を一覧します。
  • 散布図コードを完成させます。データセット df を使い、サンプルの砂糖含有量を x 軸にプロットし(y は 0 に固定)、1次元の配置にします。
  • ggplot() のコードを書いて、df の砂糖含有量を散布図として表示します。高い砂糖含有量と低い砂糖含有量のサンプルに対応する、2つのはっきりしたクラスタが見つかりますか?