Relaties tussen variabelen visualiseren
In de vorige oefening heb je misschien gezien dat een langere marriage_duration samenhangt met meer kinderen, weergegeven in de kolom num_kids. De correlatiecoëfficiënt tussen de variabelen marriage_duration en num_kids is 0.45.
In deze oefening maak je een scatterplot om de relatie tussen deze variabelen te visualiseren. pandas is geladen als pd, matplotlib.pyplot als plt, en Seaborn als sns. De gegevensset heet divorce.
Deze oefening maakt deel uit van de cursus
Exploratory Data Analysis in Python
Oefeninstructies
- Maak een scatterplot met
marriage_durationop de x-as ennum_kidsop de y-as.
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# Create the scatterplot
____
plt.show()