1. Nauka
  2. /
  3. Kursy
  4. /
  5. Czyszczenie danych w R

Connected

ćwiczenie

Wykrywanie niespójnych danych tekstowych

Zespół obsługi klienta chce skontaktować się z uczestnikami ankiety SFO, aby zadać im kilka dodatkowych pytań. Problem polega na tym, że automatyczny system wybierania numerów nie jest w stanie poprawnie odczytać wszystkich numerów telefonów – każdy z nich zapisano w innym formacie. Po bliższym przyjrzeniu się danym okazało się, że część numerów zawiera łączniki (-), a część – nawiasy ((,)). W tym ćwiczeniu znajdziesz numery telefonów, które mają ten problem, i ustalisz, które z nich wymagają poprawki.

Biblioteki dplyr i stringr są wczytane, a zbiór danych sfo_survey jest dostępny.

Instrukcje 1/2

undefined XP
  • 1
    • Odfiltruj wiersze z numerami telefonów zawierającymi "-".
  • 2
    • Odfiltruj wiersze z numerami telefonów zawierającymi "(" lub ")". Pamiętaj, aby podczas wyszukiwania nawiasów użyć funkcji fixed().