MulaiMulai sekarang secara gratis

Inspeksi variabel

Kini setelah kita menambahkan beberapa variabel baru ke abaloneMod, rangkaian latihan berikutnya akan menelaah kualitas data menggunakan statistik ringkas dan visualisasi grafis.

Anda juga akan melakukan filter() untuk mengeluarkan kasus (baris dalam himpunan data abaloneMod) yang mengandung kesalahan atau nilai tidak logis menggunakan fungsi dplyr::filter(). Misalnya, ada beberapa abalon yang memiliki height 0 mm, yang tidak benar dan kemungkinan disebabkan kesalahan ketik atau kesalahan pengukuran.

Himpunan data abaloneMod telah dimuat untuk Anda bersama paket dplyr dan ggplot2. Setelah menyaring kasus, Anda akan membuat salinan termodifikasi baru dari himpunan data bernama abaloneKeep yang berisi kasus final yang dipertahankan untuk analisis pada pelajaran berikutnya.

Latihan ini adalah bagian dari kursus

R untuk Pengguna SAS

Lihat Kursus

Petunjuk latihan

  • Dapatkan statistik ringkas untuk tinggi abalon.
  • Pertahankan kasus dengan tinggi lebih besar dari 0 dan tetapkan kasus tersebut ke dataframe baru abaloneKeep.
  • Untuk abalon yang dipertahankan dalam abaloneKeep, buat histogram tinggi yang sekarang semuanya seharusnya lebih besar dari 0.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Pull height from abaloneMod and run summary()
___ %>% 
  ___ %>%
  ___

# Keep cases with height > 0 assign to abaloneKeep
___ <- ___ %>%
  ___

# Make histogram of updated heights in abaloneKeep
ggplot(___) +
  ___
Edit dan Jalankan Kode