Correlaties in je data vinden
Correlaties tussen ontbrekende data vinden helpt je beter te begrijpen welk type missings je hebt en welke geschikte manieren er zijn om de ontbrekende waarden aan te pakken. In de laatste video-oefening heb je twee belangrijke technieken geleerd om visueel correlaties tussen missende data te detecteren: heatmaps en dendrogrammen.
In deze oefening maak je een heatmap en een dendrogram van missings voor de diabetes-gegevensset met behulp van het missingno-pakket. Dit is geïmporteerd als msno.
Deze oefening maakt deel uit van de cursus
Omgaan met ontbrekende gegevens in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import missingno
import missingno as msno
# Plot missingness heatmap of diabetes
___.___(___)
# Show plot
plt.show()