Imputer et compléter les valeurs manquantes à l’aide de moyennes
Lorsque vous réaliserez votre analyse, vous utiliserez probablement vos propres données. Les jeux de données contiennent souvent des valeurs manquantes. Dans cet exercice, vous allez vous entraîner à imputer ces valeurs manquantes. L’imputation est importante, car vous ne voulez pas que les valeurs manquantes freinent votre analyse.
pandas a été importé sous l’alias pd et NumPy sous l’alias np. Un DataFrame pandas nommé dataset a été chargé pour vous. Il contient la colonne "Total Current Liabilities", qui comporte quelques valeurs manquantes.
Cet exercice fait partie du cours
<cours>Analyser les états financiers en Python</cours>Exercice interactif pratique
Essayez cet exercice en complétant ce code d’exemple.
# Impute missing value using average non-missing values by company
impute_by_company = dataset.____
# Impute missing value using average non-missing values by industry
impute_by_comp_type = dataset.____
print(impute_by_company)
print(impute_by_comp_type)