Missende waarden imputeren met percentielen

In deze oefening ga je verder met het imputeren van missende waarden. Anders dan in de vorige oefening gebruik je nu percentielen in plaats van gemiddelden voor de imputaties. Percentielen geven vaak conservatieve schattingen. Missende waarden in een kolom imputeren met percentielen bestaat uit de volgende stappen:

Verwijder de missende waarden uit de kolom van interesse.
Bereken vervolgens bijvoorbeeld het 70e percentiel van de waarden in die kolom waar je net de missende waarden uit hebt verwijderd.
De 70e-percentiel ‘slechtste’ waarde hangt af van de kolom waarvoor je het percentiel berekent:
- Een grote hoeveelheid activa wordt als positief gezien, dus een lage hoeveelheid activa is slechter. De 70e-percentiel ‘slechtste’ waarde voor activa is in feite gewoon het 30e percentiel van activa.
- Omgekeerd geldt dat een hoge schuldenlast als negatief wordt gezien. Dus de 70e ‘slechtste’ waarde voor passiva is simpelweg het 70e percentiel.

pandas is geladen als pd en NumPy als np. Een pandas DataFrame met de naam dataset is voor je geladen. Het bevat de kolom "Total Current Liabilities", waarin enkele waarden ontbreken.

Deze oefening maakt deel uit van de cursus

Financiële overzichten analyseren in Python

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Impute missing value with 70th percentile non-missing values of company
impute_by_company = ___

# Impute missing value with 70th percentile non-missing values of industry
impute_by_comp_type = ____

print(impute_by_company)
print(impute_by_comp_type)

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Financiële overzichten analyseren in Python

SkillTag.level.intermediateSkillTag.label

4.7+

Begin gratis met de cursus

In dit hoofdstuk leer je hoe je een balans leest en interpreteert, en hoe je financiële ratio’s berekent en gebruikt om de prestaties van een bedrijf te evalueren aan de hand van informatie uit de balans. Daarnaast doe je praktijkervaring op met het krachtige pandas-pakket voor gegevensbewerking om de financiële ratio’s van een bedrijf te analyseren en ze te vergelijken met branchegenoten.

Exercise 1: Introductie tot de balans Exercise 2: Koppel balansposten aan hun categorie Exercise 3: Relatie tussen activa, passiva en eigen vermogen van aandeelhouders Exercise 4: Oefen met de hoofdvergelijking van de boekhouding Exercise 5: Financiële ratio's uit de balans Exercise 6: Koppel de ratio aan de juiste familie Exercise 7: Bereken de current ratio Exercise 8: Solvabiliteitsratio's Exercise 9: Financiële kengetallen berekenen met pandas Exercise 10: Bereken current ratio en debt-to-equity ratio Exercise 11: Relatief verschil per sector berekenen Exercise 12: Ratio's berekenen per sector

In dit hoofdstuk leer je hoe je een resultatenrekening leest en interpreteert, hoe je belangrijke financiële ratio’s berekent en zelfs hoe je je eigen functies in Python maakt om repetitieve taken te automatiseren. Je doet ook ervaring op met seaborn, een krachtige bibliotheek voor datavisualisatie, om figuren te maken die je helpen de financiële prestaties van een bedrijf te begrijpen.

Exercise 1: Introductie tot de winst-en-verliesrekening Exercise 2: Bereken de nettowinst Exercise 3: Ratio's berekenen uit de resultatenrekening Exercise 4: Ratio’s uit de resultatenrekening en de balans Exercise 5: De door de gebruiker gedefinieerde functie bijwerken Exercise 6: Gebruikersfunctie bijwerken om te kunnen aftrekken Exercise 7: Kengetallen berekenen met een zelfgedefinieerde functie Exercise 8: Meerdere ratio’s berekenen met de zelfgedefinieerde functie Exercise 9: Ratio’s visualiseren voor analyse binnen één bedrijf Exercise 10: Ratio’s plotten Exercise 11: Ratio’s in één figuur plotten

In dit hoofdstuk analyseer je het kasstroomoverzicht en gebruik je de informatie daaruit om financiële ratio’s te berekenen en te interpreteren. Met Seaborn maak je informatieve grafieken die financiële ratio’s tussen verschillende bedrijven vergelijken, en bouw je voort op je bestaande kennis van Python en datavisualisatie. Aan het eind van dit hoofdstuk kun je inzichten uit kasstroomoverzichten halen met Python en rommelige, realistische gegevenssets met ontbrekende waarden aan.

Exercise 1: Kasstroomoverzicht Exercise 2: Wijs kasstroomposten toe aan het juiste onderdeel Exercise 3: Bereken netto kasstroom Exercise 4: Financiële kengetallen uit het kasstroomoverzicht Exercise 5: Financiële overzichten samenvoegen Exercise 6: Kasstroomratio's berekenen Exercise 7: Missende waarden imputeren en invullen met gemiddelden Exercise 8: Missende waarden imputeren met percentielen

Huidige oefening

Exercise 9: Financiële overzichten samenvoegen en ontbrekende waarden invullen Exercise 10: Financiële kengetallen visualiseren voor vergelijking Exercise 11: Kasmstroomratio’s plotten

In dit hoofdstuk leer je over de verschillende financiële ratio’s die de winstgevendheid van een bedrijf meten, hoe je ze berekent en hoe je ze vergelijkt tussen verschillende bedrijven. Je bouwt voort op je kennis van de Seaborn-bibliotheek om visualisaties te maken die je helpen winstgevendheidsratio’s te analyseren en trends te signaleren.

Exercise 1: Een kijkje in de financiële kengetallen van enkele sectoren Exercise 2: Marges gebruiken in draaitabellen en een staafdiagram maken Exercise 3: Gegevens voorbereiden voor een facet grid-plot Exercise 4: Een facetgrid-plot maken Exercise 5: Zelfgedefinieerde functie om plots te maken Exercise 6: Winstgevendheidsstatistieken Exercise 7: Relatie tussen operationele marge en debt-to-equity voor vastgoedbedrijven Exercise 8: Oefenen met sns.regplot()Exercise 9: De door de gebruiker gedefinieerde plotfunctie bijwerken Exercise 10: Meer over het analyseren van winstgevendheid Exercise 11: Oefen met het maken van heatmaps Exercise 12: Brede analyse Exercise 13: Goed gedaan!