Değişkenleri orana göre birleştirme

Çoğu zaman, belirli düzeyleri "diğer" ile değiştirmek ya da birleştirmek istemezsin. Bunun yerine, en yaygın düzeyleri tutup geri kalan her şeyi "diğer" kategorisine koymak isteyebilirsin. Özellikle çok sayıda düzey olduğunda ve çoğu nadirken, bu yaklaşım verini görselleştirmek için çok yararlıdır. Bunu, Kaggle anketindeki insanların gelecek yıl denemek istedikleri Machine Learning yöntemleri sorusunu kullanarak deneyelim. multiple_choice_responses senin için yüklendi. Sayım yaparken, sort = TRUE varsayılan olarak azalan sırayı ifade eder, bunu unutma.

Bu egzersiz, kursun bir parçasıdır

Tidyverse'te Kategorik Veriler

Kursa Göz Atın

Egzersiz talimatları

Yöntem seçmeyen kişileri kaldır.
MLMethodNextYearSelect değişkeninden, yanıtlayanların en az %5'inin seçtiği başlıkları koruyan ve kalanları varsayılan değer olan "Other" içinde toplayan yeni bir ml_method değişkeni oluştur.
Son olarak, yeni değişkenini azalan sırada olacak şekilde say.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

multiple_choice_responses %>%
  # Remove NAs of MLMethodNextYearSelect
  filter(___) %>%
  # Create ml_method, which lumps all those with less than 5% of people into "Other"
  mutate(ml_method = ___(MLMethodNextYearSelect, ___)) %>%
  # Count the frequency of your new variable, sorted in descending order
  ___(___, ___)

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

Tidyverse'te Kategorik Veriler

InicianteNível de habilidade

4.8+

Kursa Ücretsiz Başla

Bu bölümde faktörler hakkında her şeyi öğreneceksin. Kategorik ve sıralı (ordinal) değişkenler arasındaki farkı, R’nin bunları nasıl temsil ettiğini ve seviyelerin sayılarını ve adlarını bulmak için nasıl inceleyeceğini keşfedeceksin. Son olarak, tidyverse paketi forcats’in, değişkenleri frekanslarına göre hızla yeniden sıralamana olanak tanıyarak grafiklerini nasıl iyileştirebileceğini göreceksin.

Exercise 1: Nitel değişkenlere giriş Exercise 2: Faktör değişkenleri tanıma Exercise 3: Kuramsal olarak nitel değişkenler Exercise 4: Nitel değişkenlerini anlamak Exercise 5: Seviye sayısını elde etme Exercise 6: Seviye sayısını inceleme Exercise 7: Seviyeleri inceleme Exercise 8: Daha iyi grafikler oluşturma Exercise 9: Bir değişkeni frekansına göre yeniden sıralama Exercise 10: Bir değişkeni diğerine göre sıralama

forcats paketine daha derinlemesine devam edecek, seviye sırasını ve adlarını nasıl değiştireceğini ve hatta seviyeleri birbirinin içinde nasıl birleştireceğini öğreneceksin.

Exercise 1: Faktörleri yeniden sıralama Exercise 2: Faktör düzeylerinin sırasını değiştirme Exercise 3: fct_relevel() ipuçları Exercise 4: Faktör düzeylerini yeniden adlandırma Exercise 5: forcats işlevlerini ayırt etme Exercise 6: Birkaç seviyeyi yeniden adlandırma Exercise 7: Yazım hatası yaptığında Exercise 8: Faktör seviyelerini birleştirme Exercise 9: Düzeyleri elle birleştirme Exercise 10: Değişkenleri orana göre birleştirme

Geçerli egzersiz

Exercise 11: En yaygın düzeyleri koruma

forcats’i iyice kavradıktan sonra tidyverse’in geri kalanına açılacak, dplyr, tidyr ve stringr’dan işlevleri öğrenecek ve gözden geçireceksin. Eksenleri yüzde ölçeklerine çevirerek, metin yerleşimini düzenleyerek ve daha fazlasıyla ggplot2 grafiklerini iyileştireceksin.

Exercise 1: Yaygın temalı değişkenleri inceleme Exercise 2: Benzer sütunları gruplayıp yeniden biçimlendirme Exercise 3: Verileri özetleme Exercise 4: İlk grafiği oluşturma Exercise 5: ggplot2 ipuçları Exercise 6: Grafik metnini düzenleme Exercise 7: Grafikleri yeniden sıralama Exercise 8: case_when() ile değişkenleri değiştirme ve oluşturma Exercise 9: Tek değişkenle case_when()Exercise 10: Birden çok sütundan case_when()

Bu son bölümde, öğrendiklerinin tümünü bir vaka çalışmasında uygulayacaksın. Dizgilerle (string) çalışmayı ve verileri özetlemeyi daha iyi öğrenecek, ardından 538’in yayın kalitesindeki bir grafiğini yeniden oluşturacaksın.

Exercise 1: Vaka çalışmasına giriş Exercise 2: Karakterleri faktörlere dönüştürme Exercise 3: Veri düzenleme Exercise 4: Veri hazırlama ve regex Exercise 5: Dizgeleri temizleme Exercise 6: Değişkenleri iki kategoriye ayırma Exercise 7: Veri özetleme Exercise 8: Grafiği yeniden oluşturma Exercise 9: İlk grafiği oluşturma Exercise 10: Etiketleri düzeltme Exercise 11: Her şeyi tersine çevirmek Exercise 12: Grafiği sonlandırma Exercise 13: Kurs sonu özeti