Meringkas data
Sekarang mari buat plot berfasil untuk membandingkan kegunaan di berbagai platform pembelajaran.
Dalam latihan ini, kita akan memperkenalkan fungsi dplyr baru, add_count(). add_count() menambahkan sebuah kolom pada himpunan data, n, sambil mempertahankan jumlah baris yang sama seperti himpunan data asli. Sama seperti count(), nilai default n adalah jumlah baris untuk setiap kelompok, tetapi Anda dapat mengubahnya dengan argumen wt (bobot). Anda menetapkan wt sama dengan kolom lain agar n menjadi jumlah dari kolom tersebut untuk setiap kelompok.
Misalkan Anda ingin menambahkan kolom pada iris yang merupakan jumlah Petal.Length untuk semua bunga dengan Species yang sama. Anda akan menuliskannya seperti ini:
iris %>%
add_count(Species, wt = Petal.Length) %>%
select(Species, Petal.Length, n)
Ini akan menghasilkan:
# A tibble: 150 x 3
Species Petal.Length n
<fct> <dbl> <dbl>
1 setosa 1.4 73.1
2 setosa 1.4 73.1
3 virginica 6.4 278.
Latihan ini adalah bagian dari kursus
Data Kategorikal di Tidyverse
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
learning_platform_usefulness %>%
# Change dataset to one row per learning_platform usefulness pair with number of entries for each
___(___, ___)