Aan de slagGa gratis aan de slag

Missende waarden imputeren en invullen met gemiddelden

Als je je analyse wilt doen, gebruik je waarschijnlijk je eigen data. Gegevenssets bevatten vaak missende waarden. In deze oefening ga je oefenen met het imputeren van deze missende waarden. Imputeren is belangrijk, want je wilt niet dat missende waarden je analyse in de weg zitten.

pandas is geladen met de alias pd en NumPy is geladen met de alias np. Er is een pandas DataFrame met de naam dataset voor je geladen. Het bevat de kolom "Total Current Liabilities", waarin enkele waarden ontbreken.

Deze oefening maakt deel uit van de cursus

Financiële overzichten analyseren in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Impute missing value using average non-missing values by company
impute_by_company = dataset.____

# Impute missing value using average non-missing values by industry
impute_by_comp_type = dataset.____

print(impute_by_company)
print(impute_by_comp_type)
Code bewerken en uitvoeren