MulaiMulai sekarang secara gratis

Melakukan ringkasan berkelompok atas keberadaan nilai hilang

Sekarang setelah Anda dapat membuat data nabular, mari kita gunakan untuk mengeksplorasi data. Mari hitung statistik ringkasan berdasarkan keberadaan nilai hilang pada variabel lain.

Untuk melakukan ini, kita akan mengikuti langkah-langkah berikut:

  • Pertama, bind_shadow() mengubah data menjadi data nabular.

  • Selanjutnya, lakukan beberapa ringkasan pada data menggunakan group_by() dan summarize() untuk menghitung mean dan simpangan baku, dengan fungsi mean() dan sd().

Latihan ini adalah bagian dari kursus

Menangani Data Hilang di R

Lihat Kursus

Petunjuk latihan

  • Untuk himpunan data oceanbuoys:

  • Lakukan bind_shadow(), lalu group_by() berdasarkan keberadaan nilai hilang pada humidity (humidity_NA) dan hitung mean serta simpangan baku untuk angin timur–barat (wind_ew) menggunakan summarize() dari dplyr.

  • Ulangi langkah ini, tetapi hitung ringkasan untuk angin utara–selatan (wind_ns).

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# `bind_shadow()` and `group_by()` humidity missingness (`humidity_NA`)
oceanbuoys %>%
  ___() %>%
  group_by(___) %>% 
  summarize(wind_ew_mean = mean(___), # calculate mean of wind_ew
            wind_ew_sd = ___)) # calculate standard deviation of wind_ew
  
# Repeat this, but calculating summaries for wind north south (`wind_ns`).
___ %>%
  ___ %>%
  group_by(___) %>%
  summarize(___ = ___(___),
            ___ = ___(___))
Edit dan Jalankan Kode