eBay-veilingen modelleren
Soms laat een model op de hele gegevensset trends zien die niet overeenkomen met modellen op afzonderlijke delen van die gegevensset. Dit staat bekend als de paradox van Simpson. In het extreemste geval zie je een positieve helling op de hele gegevensset en negatieve hellingen op elk subset van die gegevensset (of andersom).
In de komende oefeningen kijk je naar eBay-veilingen van Palm Pilot M515 PDA-modellen.
| variable | meaning |
|---|---|
price |
Eindverkoopprijs, USD |
openbid |
De openingsbod, USD |
auction_type |
Hoe lang duurde de veiling? |
auctions is beschikbaar; dplyr en ggplot2 zijn geladen.
Deze oefening maakt deel uit van de cursus
Intermediary Regression in R
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Take a glimpse at the dataset
___
# Model price vs. opening bid using auctions
mdl_price_vs_openbid <- ___
# See the result
mdl_price_vs_openbid