Aan de slagGa gratis aan de slag

Bivariabele plots in pandas

Meerdere variabelen tegelijk vergelijken is ook een handige manier om je data te begrijpen. Als je twee continue variabelen hebt, gebruik je meestal een scatterplot.

# Scatter plot
df.plot(x='x_column', y='y_column', kind='scatter')
plt.show()

Je kunt een boxplot gebruiken om één continue en één categorische variabele te vergelijken. Je gebruikt dan echter de .boxplot()-methode in plaats van de .plot()-methode.

# Boxplot
df.boxplot(column='y_column', by='x_axis')
plt.show()

Deze oefening maakt deel uit van de cursus

Python voor R-gebruikers

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

import matplotlib.pyplot as plt

# Scatter plot between the tip and total_bill
tips.plot(____, ____, ____)
plt.show()
Code bewerken en uitvoeren