Periksa pengukuran dimensi
Sejauh ini Anda telah menghapus 2 kasus dengan tinggi abalon 0 mm yang diukur secara keliru. Anda juga menghapus 4 kasus di mana shuckedWeight lebih besar daripada wholeWeight, yang tidak logis dan kemungkinan akibat kesalahan pencatatan. Himpunan data abaloneKeep yang dimuat untuk latihan ini sekarang hanya memiliki 4177 - 2 - 4 = 4171 kasus.
Selain itu, hubungan antar pengukuran dimensi juga perlu ditinjau. length abalon (dalam mm) didefinisikan sebagai ukuran cangkang terpanjang. Jadi, length harus selalu lebih besar daripada height atau diameter. Sekarang, Anda akan memeriksa ketentuan ini menggunakan scatterplot dengan garis referensi Y=X. Anda kemudian akan menghapus kasus apa pun yang tidak memenuhi ketentuan length ini.
Himpunan data abaloneKeep, serta paket dplyr dan ggplot2, juga telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
R untuk Pengguna SAS
Petunjuk latihan
- Buat scatterplot
lengthpada sumbu x danheightpada sumbu y, lalu tambahkan garis referensi Y=X dengan intercept 0 dan slope 1. - Buat scatterplot
lengthpada sumbu x dandiameterpada sumbu y, lalu tambahkan garis referensi Y=X dengan intercept 0 dan slope 1. - Perbarui
abaloneKeepuntuk mempertahankan abalon denganlengthyang lebih besar daripadaheightdandiametersekaligus.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Make scatterplot of height by length add y=x line
ggplot(___) +
___ +
___
# Make scatterplot of diameter by length add y=x line
ggplot(___) +
___ +
___
# Keep abalones with length > both height and diameter
abaloneKeep <- abaloneKeep %>%
filter((___) & (___))