ComeçarComece de graça

Distribuição amostral nula do coeficiente angular

No capítulo anterior, você investigou a distribuição amostral do coeficiente angular (slope) em uma população onde esse coeficiente era diferente de zero. No entanto, para fazer inferência, geralmente você precisa conhecer a distribuição amostral do coeficiente angular sob a hipótese de que não há relação entre as variáveis explicativa e resposta. Além disso, na maioria das situações, você não conhece a população de onde os dados vieram, então a distribuição amostral nula precisa ser derivada apenas do conjunto de dados original.

Em meados do século XX, um estudo localizou gêmeos idênticos separados ao nascer: uma criança foi criada pelos pais biológicos e a outra em um lar adotivo. Para tentar responder à pergunta sobre se a inteligência é resultado de “nature” (genética) ou “nurture” (ambiente), ambas as crianças fizeram testes de QI. Os dados resultantes contêm os QIs dos gêmeos adotivos (Foster, variável resposta) e os QIs dos gêmeos biológicos (Biological, variável explicativa).

Neste exercício você vai usar a função pull(). Essa função recebe um data frame e retorna a coluna selecionada como um vetor (semelhante a $).

Este exercício faz parte do curso

Inferência para Regressão Linear em R

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

library(infer)

# Calculate the observed slope
# Run a lin. reg. of Foster vs. Biological on the twins data
obs_slope <- ___(___, ___) %>%
  # Tidy the result
  ___() %>%   
  # Filter for rows where term equal Biological
  ___(___) %>%
  # Pull out the estimate column
  ___(___) 

# See the result
obs_slope
Editar e executar o código