CommencerCommencer gratuitement

Standardiser vos données

Dans le cours, nous avons vu que l’on peut apprendre beaucoup d’un jeu de données en construisant la matrice \(A^TA\). Dans cet exercice, vous allez l’appliquer à des données athlétiques de joueurs se présentant à la draft universitaire de la National Football League. Le jeu de données combine est déjà chargé.

Cet exercice fait partie du cours

Algèbre linéaire pour la data science en R

Afficher le cours

Instructions

  • Extraire uniquement les éléments numériques du data frame en ne prenant que les colonnes 5 à 12. Appelez cet objet A (nous ne pouvons pas faire de calculs sur les composants non numériques des colonnes 1 à 4).
  • Transformer ce data frame en matrice avec la commande as.matrix().
  • Soustraire la moyenne de chacune des colonnes de la matrice.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Extract columns 5-12 of combine
A <- combine[, ___:___]

# Make A into a matrix
A <- ___(A)

# Subtract the mean of each column
A[, ___] <- A[, 1] - mean(A[, 1])
A[, 2] <- A[, 2] - ___(A[, 2])
A[, ___] <- A[, 3] - mean(A[, 3])
A[, ___] <- A[, ___] - mean(A[, 4])
A[, 5] <- A[, 5] - mean(A[, 5])
A[, ___] <- A[, 6] - mean(A[, ___])
A[, 7] <- A[, ___] - mean(A[, 7])
A[, ___] <- A[, 8] - mean(A[, 8])
Modifier et exécuter le code