Gemiddelden per categorie berekenen
Een goede manier om categorische variabelen te verkennen is door samenvattende statistieken, zoals het gemiddelde, per categorie te berekenen. Hier bekijk je gegroepeerde gemiddelden voor de huizenprijzen in de Taiwan real estate-gegevensset.
taiwan_real_estate is beschikbaar en dplyr is geladen.
Deze oefening maakt deel uit van de cursus
Introductie tot regressie in R
Oefeninstructies
- Groepeer
taiwan_real_estateophouse_age_years. - Vat samen om het gemiddelde van
price_twd_msqper groep te berekenen, en noem de kolommean_by_group. - Wijs het resultaat toe aan
summary_statsen bekijk de getallen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
summary_stats <- taiwan_real_estate %>%
# Group by house age
___ %>%
# Summarize to calculate the mean house price/area
___(mean_by_group = ___)
# See the result
summary_stats