ComeçarComece de graça

Examinando a estrutura de entradas categóricas

Neste exercício, você vai chamar model.matrix() (docs) para examinar como o R representa dados com entradas categóricas e numéricas para modelagem. O conjunto de dados flowers (derivado do pacote Sleuth3) já foi carregado para você. Ele tem as seguintes colunas:

  • Flowers: o número médio de flores em uma planta de meadowfoam
  • Intensity: a intensidade de um tratamento de luz aplicado à planta
  • Time: uma variável categórica — quando (Late ou Early) no ciclo de vida o tratamento de luz ocorreu

O objetivo final é prever Flowers como função de Time e Intensity.

Este exercício faz parte do curso

Aprendizado Supervisionado em R: Regressão

Ver curso

Instruções do exercício

  • Chame a função str() em flowers para ver os tipos de cada coluna.
  • Use a função unique() na coluna flowers$Time para ver os valores possíveis que Time assume. Quantos valores únicos existem?
  • Crie uma fórmula para expressar Flowers como função de Intensity e Time. Atribua-a à variável fmla e imprima-a.
  • Use fmla e model.matrix() para criar a matriz do modelo para o data frame flowers. Atribua-a à variável mmat.
  • Use head() para examinar as primeiras 20 linhas de flowers.
  • Agora examine as primeiras 20 linhas de mmat.
    • A coluna numérica Intensity está diferente?
    • O que aconteceu com a coluna categórica Time de flowers?
    • Como Time == 'Early' é representado? E Time == 'Late'?

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Call str on flowers to see the types of each column
___

# Use unique() to see how many possible values Time takes
___

# Build and print a formula to express Flowers as a function of Intensity and Time: fmla
(fmla <- ___("Flowers ~ Intensity + Time"))

# Use fmla and model.matrix to see how the data is represented for modeling
mmat <- ___

# Examine the first 20 lines of flowers
___

# Examine the first 20 lines of mmat
___
Editar e executar o código