Padronizando seus dados
Na aula, vimos que é possível aprender muito sobre um conjunto de dados criando a matriz \(A^TA\). Neste exercício, você fará isso com dados atléticos de jogadores inscritos no draft universitário da National Football League. O conjunto de dados combine já está carregado para você.
Este exercício faz parte do curso
Álgebra Linear para Data Science em R
Instruções do exercício
- Extraia apenas os elementos numéricos do data frame pegando apenas as colunas da 5ª à 12ª. Chame isso de
A(não podemos fazer contas com os componentes não numéricos nas colunas 1 a 4). - Transforme esse data frame em uma matriz usando o comando
as.matrix(). - Subtraia a média de cada uma das colunas da matriz.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Extract columns 5-12 of combine
A <- combine[, ___:___]
# Make A into a matrix
A <- ___(A)
# Subtract the mean of each column
A[, ___] <- A[, 1] - mean(A[, 1])
A[, 2] <- A[, 2] - ___(A[, 2])
A[, ___] <- A[, 3] - mean(A[, 3])
A[, ___] <- A[, ___] - mean(A[, 4])
A[, 5] <- A[, 5] - mean(A[, 5])
A[, ___] <- A[, 6] - mean(A[, ___])
A[, 7] <- A[, ___] - mean(A[, 7])
A[, ___] <- A[, 8] - mean(A[, 8])