Benzer sütunları gruplayıp yeniden biçimlendirme

Bu derste, Kaggle veri bilimi anketi veri kümesindeki bazı sütunların birbiriyle ilişkili olduğunu gördük; örneğin farklı iş zorluklarının sıklığını ele alan sütunlar gibi. Genellikle bu değişkenlere birlikte bakmak isteriz ama önce onları bulup kullanımı daha kolay bir formata dönüştürmemiz gerekir. Bunu, katılımcıların öğrenme için farklı platformları ne kadar faydalı bulduğuna dair sorularla deneyelim.

multiple_choice_responses veri kümesi senin için yüklendi.

Bu egzersiz, kursun bir parçasıdır

Tidyverse'te Kategorik Veriler

Kursa Göz Atın

Egzersiz talimatları

Adında "LearningPlatformUsefulness" geçen sütunları seç.
Veriyi geniş formattan iki sütunlu uzun formata çevir: learning_platform ve usefulness.
usefulness değeri NA olan satırları kaldır.
learning_platform içindeki her dizgeden "LearningPlatformUsefulness" ifadesini kaldır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

learning_platform_usefulness <- multiple_choice_responses %>%
  # Select columns with LearningPlatformUsefulness in title
  ___(___("LearningPlatformUsefulness")) %>%
  # Change data from wide to long
  ___(everything(), names_to = "learning_platform", values_to = "usefulness") %>%
  # Remove rows where usefulness is NA
  ___(___()) %>%
  # Remove "LearningPlatformUsefulness" from each string in learning_platform 
  mutate(learning_platform = ___())

Kodu Düzenle ve Çalıştır

Bu egzersiz, kursun bir parçasıdır

Tidyverse'te Kategorik Veriler

InicianteNível de habilidade

4.8+

Kursa Ücretsiz Başla

Bu bölümde faktörler hakkında her şeyi öğreneceksin. Kategorik ve sıralı (ordinal) değişkenler arasındaki farkı, R’nin bunları nasıl temsil ettiğini ve seviyelerin sayılarını ve adlarını bulmak için nasıl inceleyeceğini keşfedeceksin. Son olarak, tidyverse paketi forcats’in, değişkenleri frekanslarına göre hızla yeniden sıralamana olanak tanıyarak grafiklerini nasıl iyileştirebileceğini göreceksin.

Exercise 1: Nitel değişkenlere giriş Exercise 2: Faktör değişkenleri tanıma Exercise 3: Kuramsal olarak nitel değişkenler Exercise 4: Nitel değişkenlerini anlamak Exercise 5: Seviye sayısını elde etme Exercise 6: Seviye sayısını inceleme Exercise 7: Seviyeleri inceleme Exercise 8: Daha iyi grafikler oluşturma Exercise 9: Bir değişkeni frekansına göre yeniden sıralama Exercise 10: Bir değişkeni diğerine göre sıralama

forcats paketine daha derinlemesine devam edecek, seviye sırasını ve adlarını nasıl değiştireceğini ve hatta seviyeleri birbirinin içinde nasıl birleştireceğini öğreneceksin.

Exercise 1: Faktörleri yeniden sıralama Exercise 2: Faktör düzeylerinin sırasını değiştirme Exercise 3: fct_relevel() ipuçları Exercise 4: Faktör düzeylerini yeniden adlandırma Exercise 5: forcats işlevlerini ayırt etme Exercise 6: Birkaç seviyeyi yeniden adlandırma Exercise 7: Yazım hatası yaptığında Exercise 8: Faktör seviyelerini birleştirme Exercise 9: Düzeyleri elle birleştirme Exercise 10: Değişkenleri orana göre birleştirme Exercise 11: En yaygın düzeyleri koruma

forcats’i iyice kavradıktan sonra tidyverse’in geri kalanına açılacak, dplyr, tidyr ve stringr’dan işlevleri öğrenecek ve gözden geçireceksin. Eksenleri yüzde ölçeklerine çevirerek, metin yerleşimini düzenleyerek ve daha fazlasıyla ggplot2 grafiklerini iyileştireceksin.

Exercise 1: Yaygın temalı değişkenleri inceleme Exercise 2: Benzer sütunları gruplayıp yeniden biçimlendirme

Geçerli egzersiz

Exercise 3: Verileri özetleme Exercise 4: İlk grafiği oluşturma Exercise 5: ggplot2 ipuçları Exercise 6: Grafik metnini düzenleme Exercise 7: Grafikleri yeniden sıralama Exercise 8: case_when() ile değişkenleri değiştirme ve oluşturma Exercise 9: Tek değişkenle case_when()Exercise 10: Birden çok sütundan case_when()

Bu son bölümde, öğrendiklerinin tümünü bir vaka çalışmasında uygulayacaksın. Dizgilerle (string) çalışmayı ve verileri özetlemeyi daha iyi öğrenecek, ardından 538’in yayın kalitesindeki bir grafiğini yeniden oluşturacaksın.

Exercise 1: Vaka çalışmasına giriş Exercise 2: Karakterleri faktörlere dönüştürme Exercise 3: Veri düzenleme Exercise 4: Veri hazırlama ve regex Exercise 5: Dizgeleri temizleme Exercise 6: Değişkenleri iki kategoriye ayırma Exercise 7: Veri özetleme Exercise 8: Grafiği yeniden oluşturma Exercise 9: İlk grafiği oluşturma Exercise 10: Etiketleri düzeltme Exercise 11: Her şeyi tersine çevirmek Exercise 12: Grafiği sonlandırma Exercise 13: Kurs sonu özeti