MulaiMulai sekarang secara gratis

Meringkas data

Sekarang mari buat plot berfasil untuk membandingkan kegunaan di berbagai platform pembelajaran.

Dalam latihan ini, kita akan memperkenalkan fungsi dplyr baru, add_count(). add_count() menambahkan sebuah kolom pada himpunan data, n, sambil mempertahankan jumlah baris yang sama seperti himpunan data asli. Sama seperti count(), nilai default n adalah jumlah baris untuk setiap kelompok, tetapi Anda dapat mengubahnya dengan argumen wt (bobot). Anda menetapkan wt sama dengan kolom lain agar n menjadi jumlah dari kolom tersebut untuk setiap kelompok.

Misalkan Anda ingin menambahkan kolom pada iris yang merupakan jumlah Petal.Length untuk semua bunga dengan Species yang sama. Anda akan menuliskannya seperti ini:

iris %>%
   add_count(Species, wt = Petal.Length) %>%
   select(Species, Petal.Length, n)

Ini akan menghasilkan:

# A tibble: 150 x 3
   Species Petal.Length     n
   <fct>          <dbl> <dbl>
 1 setosa           1.4  73.1
 2 setosa           1.4  73.1
 3 virginica        6.4  278.

Latihan ini adalah bagian dari kursus

Data Kategorikal di Tidyverse

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

learning_platform_usefulness %>%
  # Change dataset to one row per learning_platform usefulness pair with number of entries for each
  ___(___, ___)
Edit dan Jalankan Kode