Excurso: Correlação
Se você conhece estatística, já deve ter ouvido falar da Correlação de Pearson. Ela mede a dependência linear entre duas variáveis, digamos, \(X\) e \(Y\). Seu valor varia de -1 a 1; quando está perto de 1, há uma forte associação positiva entre as variáveis. Se \(X\) é alta, \(Y\) tende a ser alta também. Quando está perto de -1, há uma forte associação negativa: se \(X\) é alta, \(Y\) tende a ser baixa. Quando a correlação de Pearson entre duas variáveis é 0, essas variáveis são possivelmente independentes: não há associação entre \(X\) e \(Y\).
Você pode calcular a correlação entre dois vetores com a função cor(). Veja este exemplo, que calcula a correlação entre as colunas height e width de um data frame fictício size:
cor(size$height, size$width)
Os dados com que você trabalhou no exercício anterior, international.sav, estão novamente disponíveis no seu diretório de trabalho. Agora, cabe a você importá-los e fazer os cálculos corretos para responder à seguinte pergunta:
Qual é o coeficiente de correlação para as duas variáveis numéricas gdp e f_illit (taxa de analfabetismo feminino)?
Este exercício faz parte do curso
Importação de dados intermediária em R
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
Começar o exercício