1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w R

Connected

ćwiczenie

Nieprawidłowa wartość

Wiesz już, jak identyfikować problemy z ograniczeniami przynależności – czas je naprawić na nowym zbiorze danych. W tym rozdziale będziesz pracować ze zbiorem danych sfo_survey, który zawiera odpowiedzi pasażerów odlatujących z lotniska San Francisco International Airport (SFO). Uczestnicy ankiety oceniali czystość lotniska, czas oczekiwania, bezpieczeństwo oraz ogólny poziom zadowolenia.

Podczas zbierania danych pojawiły się pewne problemy, które spowodowały niespójności w zbiorze. W tym ćwiczeniu skupisz się na kolumnie dest_size, która określa wielkość lotniska docelowego, na które lecieli pasażerowie. Dostępna jest ramka danych dest_sizes zawierająca wszystkie prawidłowe kategorie wielkości. Twoim zadaniem jest znalezienie wierszy z nieprawidłowymi wartościami dest_size i usunięcie ich z ramki danych.

Biblioteka dplyr jest załadowana, a sfo_survey i dest_sizes są dostępne.

Instrukcje 1/4

undefined XP
    1
    2
    3
    4
  • Zlicz liczbę wystąpień każdej wartości dest_size w sfo_survey.