1. Learn
  2. /
  3. 课程
  4. /
  5. R 入门

Connected

道练习

什么是 factor,为什么要用它?

在本章中,您将走进 factor 的精彩世界。

factor 指的是一种用于存储分类变量的统计数据类型。分类变量与连续变量的区别在于:分类变量只能取有限个类别;而连续变量则可以对应无限多个取值。

让 R 明确变量是连续还是分类非常重要,因为您之后要构建的统计模型会对这两类变量采取不同的处理方式。(至于原因,您稍后会看到。)

一个很好的分类变量示例是性别。在很多情况下,性别可以限定为 "Male" 或 "Female"。(有时您可能需要不同的类别。例如,需要考虑染色体差异、雌雄同体的动物,或不同的文化规范,但类别的数量始终是有限的。)

说明

100 XP

将值 "factors" 赋给变量 theory。