Mulai sekarangMulai gratis

Inspeksi variabel

Kini setelah kita menambahkan beberapa variabel baru ke abaloneMod, rangkaian latihan berikutnya akan menelaah kualitas data menggunakan statistik ringkas dan visualisasi grafis.

Anda juga akan melakukan filter() untuk mengeluarkan kasus (baris dalam himpunan data abaloneMod) yang mengandung kesalahan atau nilai tidak logis menggunakan fungsi dplyr::filter(). Misalnya, ada beberapa abalon yang memiliki height 0 mm, yang tidak benar dan kemungkinan disebabkan kesalahan ketik atau kesalahan pengukuran.

Himpunan data abaloneMod telah dimuat untuk Anda bersama paket dplyr dan ggplot2. Setelah menyaring kasus, Anda akan membuat salinan termodifikasi baru dari himpunan data bernama abaloneKeep yang berisi kasus final yang dipertahankan untuk analisis pada pelajaran berikutnya.

Latihan ini merupakan bagian dari kursus

R untuk Pengguna SAS

Lihat Kursus

Instruksi latihan

  • Dapatkan statistik ringkas untuk tinggi abalon.
  • Pertahankan kasus dengan tinggi lebih besar dari 0 dan tetapkan kasus tersebut ke dataframe baru abaloneKeep.
  • Untuk abalon yang dipertahankan dalam abaloneKeep, buat histogram tinggi yang sekarang semuanya seharusnya lebih besar dari 0.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Pull height from abaloneMod and run summary()
___ %>% 
  ___ %>%
  ___

# Keep cases with height > 0 assign to abaloneKeep
___ <- ___ %>%
  ___

# Make histogram of updated heights in abaloneKeep
ggplot(___) +
  ___
Edit dan Jalankan Kode