Relaties tussen variabelen visualiseren
In de vorige oefening heb je misschien gezien dat een langere marriage_duration samenhangt met meer kinderen, weergegeven in de kolom num_kids. De correlatiecoëfficiënt tussen de variabelen marriage_duration en num_kids is 0.45.
In deze oefening maak je een scatterplot om de relatie tussen deze variabelen te visualiseren. pandas is geladen als pd, matplotlib.pyplot als plt, en Seaborn als sns. De gegevensset heet divorce.
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in Python
Oefeninstructies
- Maak een scatterplot met
marriage_durationop de x-as ennum_kidsop de y-as.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create the scatterplot
____
plt.show()