IniziaInizia gratis

Esaminare la struttura degli input categorici

In questo esercizio userai model.matrix() (docs) per esaminare come R rappresenta, ai fini del modeling, dati con input sia categorici sia numerici. Il dataset flowers (derivato dal pacchetto Sleuth3) è già stato caricato. Contiene le seguenti colonne:

  • Flowers: il numero medio di fiori su una pianta di meadowfoam
  • Intensity: l’intensità di un trattamento luminoso applicato alla pianta
  • Time: una variabile categorica — quando (Late o Early) nel ciclo di vita è avvenuto il trattamento luminoso

L’obiettivo finale è prevedere Flowers in funzione di Time e Intensity.

Questo esercizio fa parte del corso

Supervised Learning in R: Regression

Visualizza il corso

Istruzioni dell'esercizio

  • Chiama la funzione str() su flowers per vedere i tipi di ciascuna colonna.
  • Usa la funzione unique() sulla colonna flowers$Time per vedere i possibili valori assunti da Time. Quanti valori unici ci sono?
  • Crea una formula per esprimere Flowers in funzione di Intensity e Time. Assegnala alla variabile fmla e stampala.
  • Usa fmla e model.matrix() per creare la matrice del modello per il data frame flowers. Assegnala alla variabile mmat.
  • Usa head() per esaminare le prime 20 righe di flowers.
  • Ora esamina le prime 20 righe di mmat.
    • La colonna numerica Intensity è diversa?
    • Che cosa è successo alla colonna categorica Time di flowers?
    • Come è rappresentato Time == 'Early'? E Time == 'Late'?

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Call str on flowers to see the types of each column
___

# Use unique() to see how many possible values Time takes
___

# Build and print a formula to express Flowers as a function of Intensity and Time: fmla
(fmla <- ___("Flowers ~ Intensity + Time"))

# Use fmla and model.matrix to see how the data is represented for modeling
mmat <- ___

# Examine the first 20 lines of flowers
___

# Examine the first 20 lines of mmat
___
Modifica ed esegui il codice