1. Learn
  2. /
  3. 课程
  4. /
  5. R 的可扩展数据处理

Connected

道练习

查找可预测的缺失

如果数据是完全随机缺失,那么您不应该能够根据其余数据来预测某个变量何时缺失。因此,如果您能预测缺失,那么数据就不是完全随机缺失。现在,使用 glm() 函数拟合一个逻辑回归,基于您之前创建的 mort 变量中的可负担性来寻找缺失情况。如果您在缺失数据中没有发现结构——也就是说,斜率项不显著——这并不意味着已经证明数据是随机缺失,但这种可能性是存在的。

说明

100 XP
  • 在按揭数据中创建一个变量,指示 "borrower_race" 是否缺失(等于 9)。
  • 将 "affordability" 列创建为一个因子变量。
  • 用 borrower_race_ind 回归 affordability_factor,并对结果调用 summary()。