eBay-veilingen modelleren
Soms laat een model op de hele gegevensset trends zien die niet overeenkomen met modellen op afzonderlijke delen van die gegevensset. Dit staat bekend als de paradox van Simpson. In het extreemste geval zie je een positieve helling op de hele gegevensset en negatieve hellingen op elk subset van die gegevensset (of andersom).
In de komende oefeningen kijk je naar eBay-veilingen van Palm Pilot M515 PDA-modellen.
| variable | meaning |
|---|---|
price |
Eindverkoopprijs, USD |
openbid |
De openingsbod, USD |
auction_type |
Hoe lang duurde de veiling? |
auctions is beschikbaar; dplyr en ggplot2 zijn geladen.
Deze oefening maakt deel uit van de cursus
Intermediary Regression in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Take a glimpse at the dataset
___
# Model price vs. opening bid using auctions
mdl_price_vs_openbid <- ___
# See the result
mdl_price_vs_openbid