Distribuição amostral nula do coeficiente angular
No capítulo anterior, você investigou a distribuição amostral do coeficiente angular (slope) em uma população onde esse coeficiente era diferente de zero. No entanto, para fazer inferência, geralmente você precisa conhecer a distribuição amostral do coeficiente angular sob a hipótese de que não há relação entre as variáveis explicativa e resposta. Além disso, na maioria das situações, você não conhece a população de onde os dados vieram, então a distribuição amostral nula precisa ser derivada apenas do conjunto de dados original.
Em meados do século XX, um estudo localizou gêmeos idênticos separados ao nascer: uma criança foi criada pelos pais biológicos e a outra em um lar adotivo. Para tentar responder à pergunta sobre se a inteligência é resultado de “nature” (genética) ou “nurture” (ambiente), ambas as crianças fizeram testes de QI. Os dados resultantes contêm os QIs dos gêmeos adotivos (Foster, variável resposta) e os QIs dos gêmeos biológicos (Biological, variável explicativa).
Neste exercício você vai usar a função pull(). Essa função recebe um data frame e retorna a coluna selecionada como um vetor (semelhante a $).
Este exercício faz parte do curso
Inferência para Regressão Linear em R
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
library(infer)
# Calculate the observed slope
# Run a lin. reg. of Foster vs. Biological on the twins data
obs_slope <- ___(___, ___) %>%
# Tidy the result
___() %>%
# Filter for rows where term equal Biological
___(___) %>%
# Pull out the estimate column
___(___)
# See the result
obs_slope