Melakukan ringkasan berkelompok atas keberadaan nilai hilang
Sekarang setelah Anda dapat membuat data nabular, mari kita gunakan untuk mengeksplorasi data. Mari hitung statistik ringkasan berdasarkan keberadaan nilai hilang pada variabel lain.
Untuk melakukan ini, kita akan mengikuti langkah-langkah berikut:
Pertama,
bind_shadow()mengubah data menjadi data nabular.Selanjutnya, lakukan beberapa ringkasan pada data menggunakan
group_by()dansummarize()untuk menghitung mean dan simpangan baku, dengan fungsimean()dansd().
Latihan ini adalah bagian dari kursus
Menangani Data Hilang di R
Petunjuk latihan
Untuk himpunan data
oceanbuoys:Lakukan
bind_shadow(), lalugroup_by()berdasarkan keberadaan nilai hilang pada humidity (humidity_NA) dan hitung mean serta simpangan baku untuk angin timur–barat (wind_ew) menggunakansummarize()dari dplyr.Ulangi langkah ini, tetapi hitung ringkasan untuk angin utara–selatan (
wind_ns).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# `bind_shadow()` and `group_by()` humidity missingness (`humidity_NA`)
oceanbuoys %>%
___() %>%
group_by(___) %>%
summarize(wind_ew_mean = mean(___), # calculate mean of wind_ew
wind_ew_sd = ___)) # calculate standard deviation of wind_ew
# Repeat this, but calculating summaries for wind north south (`wind_ns`).
___ %>%
___ %>%
group_by(___) %>%
summarize(___ = ___(___),
___ = ___(___))