1. Nauka
  2. /
  3. Kursy
  4. /
  5. Modelowanie ryzyka kredytowego w R

Connected

ćwiczenie

Usuwanie brakujących danych

Wiesz już, że stopa procentowa (int_rate) w zbiorze danych loan_data zależy od klienta. Niestety niektóre obserwacje mają brakujące wartości stopy procentowej. Musisz teraz ustalić, ile tych wartości brakuje, a następnie je usunąć.

W tym ćwiczeniu użyjesz funkcji which(), aby stworzyć indeks wierszy zawierających wartość NA. Następnie wykorzystasz ten indeks do usunięcia wierszy z wartościami NA.

Instrukcje

100 XP
  • Sprawdź liczbę brakujących wartości zmiennej int_rate za pomocą funkcji summary().
  • Użyj funkcji which() i is.na(), aby stworzyć indeks obserwacji bez zapisanej stopy procentowej. Wynik zapisz w obiekcie na_index.
  • Utwórz nowy zbiór danych o nazwie loan_data_delrow_na, który nie zawiera obserwacji z brakującymi stopami procentowymi.
  • Pamiętaj, że wcześniej utworzyliśmy kopię zbioru loan_data o nazwie loan_data_delcol_na. Zamiast usuwać obserwacje z brakującymi stopami procentowymi, usuń całą kolumnę int_rate, przypisując jej wartość NULL.