Periksa himpunan data final
Pada tahap ini Anda telah menambahkan enam variabel baru ke himpunan data abalone asli sehingga jumlah kolom meningkat dari 9 menjadi 15. Anda juga telah menyaring (2+4+2) = 8 kasus dengan berbagai kesalahan pengukuran atau pencatatan data, menyisakan 4169 kasus.
Dalam latihan ini Anda akan memverifikasi angka-angka tersebut dengan menjalankan dim() untuk memeriksa dimensi himpunan data final abaloneKeep. Anda juga akan menjalankan beberapa pemeriksaan pada himpunan data final ini dengan meninjau statistik ringkasan untuk semua variabel dan membuat beberapa scatterplot tambahan untuk memeriksa kembali asumsi tentang bobot dan dimensi.
Himpunan data abaloneKeep, serta paket dplyr dan ggplot2, telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
R untuk Pengguna SAS
Petunjuk latihan
- Dapatkan dimensi himpunan data final
abaloneKeep. - Dapatkan statistik ringkasan untuk semua variabel dalam
abaloneKeep. - Buat scatterplot dengan
wholeWeightpada sumbu x danshuckedWeightpada sumbu y, tambahkan garis referensi dengan intercept 0 dan slope 1. - Buat scatterplot dengan
diameterpada sumbu x danlengthpada sumbu y, tambahkan garis referensi dengan intercept 0 dan slope 1.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Dimensions of final dataset with samples in abaloneKeep
___
# Get summary statistics of all variables in abaloneKeep
___
# Scatterplot of shuckedWeight by wholeWeight add y=x line
ggplot(___) +
___ +
___
# Scatterplot of length by diameter add y=x line
ggplot(___) +
___ +
___