Aan de slagGa gratis aan de slag

De resultaten van een lmer-model weergeven

Data scientists moeten hun werk kunnen communiceren en DataCamp biedt cursussen over dit onderwerp. Uitleggen wat je hebt gedaan helpt je publiek de resultaten te begrijpen. Stem je presentatie daarom af op het kennisniveau en de verwachtingen van je publiek.

Beschrijf voor niet-technische doelgroepen de belangrijkste bevindingen uit je output. Je zou bijvoorbeeld kunnen zeggen: counties met oudere moeders hebben doorgaans lagere geboortecijfers. Voor technische doelgroepen geef je details zoals schattingswaarden van coëfficiënten, betrouwbaarheidsintervallen en teststatistieken. Boeken zoals The Chicago Guide to Writing about Multivariate Analysis geven suggesties voor het beschrijven van regressie-uitvoer.

In deze oefening ga je fixed effects extraheren en plotten. Naast het plotten van de coëfficiënten (met geom_point()) en hun 95%-betrouwbaarheidsintervallen (met geom_linerange()), voeg je een rode lijn toe aan de plot om te laten zien waar nul ligt (met geom_hline()). Als de 95%-betrouwbaarheidsintervallen nul niet bevatten, verschilt de schatting van de coëfficiënt van nul.

coord_flip() is nodig omdat ggplot geen xmin of xmax ondersteunt, alleen ymin en ymax. En theme_minimal() verandert het thema ten opzichte van de standaard.

Technische noot: Het extraheren van regressiecoëfficiënten uit lmer is lastig (zie de discussie tussen de auteurs van lmer en broom).

Deze oefening maakt deel uit van de cursus

Hiërarchische en Mixed-Effects-modellen in R

Cursus bekijken

Oefeninstructies

  • Extraheer de coëfficiënten uit het model out met tidy() uit het broom.mixed-pakket. Neem het betrouwbaarheidsinterval op.
  • Gebruik de bestaande code om de schattingen van random effects eruit te filteren.
  • Print de coëfficiëntentabel naar het scherm.
  • Plot de resultaten met ggplot2. Gebruik term voor de x-as, estimate voor de y-as, conf.low voor ymin, en conf.high voor ymax.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Extract out the parameter estimates and confidence intervals
coef_estimates <-
	___(___, ___) %>%
	filter(effect == "fixed")

# Print the new dataframe
print(___)

# Plot the results using ggplot2
ggplot(coef_estimates, aes(x = ___, y = ___,
                     ymin = ___, ymax = ___)) +
    geom_hline( yintercept = 0, color = 'red' ) +
    geom_linerange() + geom_point() + coord_flip() + theme_minimal()
Code bewerken en uitvoeren