MulaiMulai sekarang secara gratis

Periksa himpunan data final

Pada tahap ini Anda telah menambahkan enam variabel baru ke himpunan data abalone asli sehingga jumlah kolom meningkat dari 9 menjadi 15. Anda juga telah menyaring (2+4+2) = 8 kasus dengan berbagai kesalahan pengukuran atau pencatatan data, menyisakan 4169 kasus.

Dalam latihan ini Anda akan memverifikasi angka-angka tersebut dengan menjalankan dim() untuk memeriksa dimensi himpunan data final abaloneKeep. Anda juga akan menjalankan beberapa pemeriksaan pada himpunan data final ini dengan meninjau statistik ringkasan untuk semua variabel dan membuat beberapa scatterplot tambahan untuk memeriksa kembali asumsi tentang bobot dan dimensi.

Himpunan data abaloneKeep, serta paket dplyr dan ggplot2, telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

R untuk Pengguna SAS

Lihat Kursus

Petunjuk latihan

  • Dapatkan dimensi himpunan data final abaloneKeep.
  • Dapatkan statistik ringkasan untuk semua variabel dalam abaloneKeep.
  • Buat scatterplot dengan wholeWeight pada sumbu x dan shuckedWeight pada sumbu y, tambahkan garis referensi dengan intercept 0 dan slope 1.
  • Buat scatterplot dengan diameter pada sumbu x dan length pada sumbu y, tambahkan garis referensi dengan intercept 0 dan slope 1.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Dimensions of final dataset with samples in abaloneKeep
___

# Get summary statistics of all variables in abaloneKeep
___

# Scatterplot of shuckedWeight by wholeWeight add y=x line
ggplot(___) +
  ___ +
  ___

# Scatterplot of length by diameter add y=x line
ggplot(___) +
  ___ +
  ___
Edit dan Jalankan Kode