1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Eksploracyjna analiza danych w R

Connected

Bài tập

Usuwanie poziomów

Tabela kontyngencji z poprzedniego ćwiczenia ujawniła, że niektóre poziomy mają bardzo niskie liczebności. Aby uprościć analizę, warto je usunąć.

W R wymaga to dwóch kroków: najpierw przefiltrowania wierszy z poziomami o bardzo niskich liczebnościach, a następnie usunięcia tych poziomów ze zmiennej czynnikowej za pomocą droplevels(). Funkcja droplevels() zachowuje bowiem poziomy z 1 lub 2 wystąpieniami – usuwa tylko te, które nie istnieją w zbiorze danych.

Hướng dẫn

100 XP

Tabela kontyngencji z poprzedniego ćwiczenia jest dostępna w twoim środowisku jako tab.

  • Wczytaj pakiet dplyr.
  • Wyświetl tab, aby sprawdzić, który poziom zmiennej align ma najmniej wpisów.
  • Użyj filter(), aby odfiltrować wszystkie wiersze z comics z tym poziomem, a następnie usuń nieużywany poziom za pomocą droplevels(). Zapisz uproszczony zbiór danych jako comics_filtered.