1. Lära sig
  2. /
  3. Courses
  4. /
  5. Obsługa brakujących danych z imputacją w R

Connected

exercise

Wykres mozaikowy

Wykres słupkowy (spine plot) utworzony w poprzednim ćwiczeniu pozwala analizować wzorce brakujących danych dla dwóch zmiennych jednocześnie. Wykres mozaikowy uogólnia tę ideę na większą liczbę zmiennych.

W tym ćwiczeniu zaczniesz od utworzenia zmiennej dummy wskazującej, czy Stany Zjednoczone brały udział w produkcji danego filmu. Użyjesz do tego funkcji grepl(), która sprawdza, czy ciąg znaków podany jako pierwszy argument występuje w obiekcie podanym jako drugi argument. Następnie narysujesz wykres mozaikowy, aby sprawdzić, czy płeć bohatera/bohaterki koreluje z ilością brakujących danych dotyczących zarobków – zarówno dla filmów amerykańskich, jak i nieamerykańskich.

Zbiór danych biopics oraz pakiet VIM są już wczytane. Czas na eksplorację wizualną!

Uwaga: utworzono specjalną funkcjędisplay_image(), która zwraca wyniki z najnowszej wersji pakietuVIM. Pamiętaj, aby rozwinąć sekcjęHTML Viewer.

Instruktioner

100 XP
  • Przekaż dane biopics do potoku dplyr.
  • Utwórz zmienną dummy is_US_movie, która przyjmuje wartość TRUE, jeśli country zawiera ciąg "US", a FALSE w przeciwnym razie.
  • Narysuj wykres mozaikowy przedstawiający ilość brakujących danych w "earnings" z podziałem według "is_US_movie" i "sub_sex", pamiętając o przekazaniu nazw zmiennych jako ciągów znaków.