CommencerCommencez gratuitement

Imputer et compléter les valeurs manquantes à l’aide de moyennes

Lorsque vous réaliserez votre analyse, vous utiliserez probablement vos propres données. Les jeux de données contiennent souvent des valeurs manquantes. Dans cet exercice, vous allez vous entraîner à imputer ces valeurs manquantes. L’imputation est importante, car vous ne voulez pas que les valeurs manquantes freinent votre analyse.

pandas a été importé sous l’alias pd et NumPy sous l’alias np. Un DataFrame pandas nommé dataset a été chargé pour vous. Il contient la colonne "Total Current Liabilities", qui comporte quelques valeurs manquantes.

Cet exercice fait partie du cours

<cours>Analyser les états financiers en Python</cours>
Voir le cours

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Impute missing value using average non-missing values by company
impute_by_company = dataset.____

# Impute missing value using average non-missing values by industry
impute_by_comp_type = dataset.____

print(impute_by_company)
print(impute_by_comp_type)
Modifier et exécuter le code