CommencerCommencer gratuitement

EDA sur les proportions

L’analyse exploratoire des données (EDA) permet de se faire une première idée du jeu de données. Les statistiques descriptives indiquent l’ampleur, la direction et la dispersion de nos métriques moyennes, tandis que les distributions et tendances visuelles offrent des pistes plus fines pour savoir quoi explorer et pour révéler des motifs intéressants qui peuvent être masqués par des statistiques moyennes.

Mettez-vous dans la peau d’un ou d’une Data Analyst sur le point d’examiner des données d’A/B test au stade initial d’EDA, avant tout test statistique. Voyez ce que vous pouvez repérer d’intéressant dans les données. Les DataFrames AdSmart et checkout, ainsi que pandas sous pd, NumPy sous np, Matplotlib.pyplot sous plt et Seaborn sous sns, ont déjà été chargés pour vous.

La source du jeu de données Adsmart sur Kaggle est disponible ici : Kaggle dataset source is linked here.

Cet exercice fait partie du cours

A/B Testing en Python

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Calculate the mean, standard deviation and count
checkout.____(____)[____].agg({____,____,____})
Modifier et exécuter le code