Modéliser des enchères eBay
Il arrive que la modélisation d’un jeu de données entier suggère des tendances qui contredisent celles obtenues sur des sous-ensembles de ce même jeu. C’est ce que l’on appelle le paradoxe de Simpson. Dans les cas extrêmes, vous pouvez observer une pente positive sur l’ensemble des données, et des pentes négatives sur chaque sous-ensemble (ou l’inverse).
Dans les prochains exercices, vous allez explorer des enchères eBay de modèles d’assistants personnels Palm Pilot M515.
| variable | meaning |
|---|---|
price |
Prix final de vente, en USD |
openbid |
Mise à prix, en USD |
auction_type |
Durée de l’enchère |
auctions est disponible sous forme de DataFrame pandas.
Cet exercice fait partie du cours
Régression intermédiaire avec statsmodels en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Take a glimpse at the dataset
print(auctions.info())
# Model price vs. opening bid using auctions
mdl_price_vs_openbid = ____
# See the result
print(mdl_price_vs_openbid.params)