Aan de slagGa gratis aan de slag

Je KDE's verbeteren

Een manier om KDE's te verbeteren is met een rug plot. Rug plots zijn kleine streepjes onder de dichtheidscurve die precies laten zien waar elk datapunt ligt. Een rug plot toevoegen is vooral handig wanneer je niet veel data hebt.

Met kleine hoeveelheden data heb je vaak gaten in je domein zonder data, en het kan lastig zijn om te zien of een niet-nul KDE-lijn betekent dat er data aanwezig was of dat dit komt door een brede kernel. Een rug plot helpt dit te verduidelijken.

Laten we teruggaan naar de functie sns.kdeplot() om twee KDE's te tekenen: één voor de data van Vandenberg Air Force Base en één voor alle andere steden in de vervuilingsdata. Omdat er veel minder data bijdraagt aan de vorm van de Vandenberg-plot, voeg je daaronder een rug plot toe.

Deze oefening maakt deel uit van de cursus

Je datavisualisaties verbeteren in Python

Cursus bekijken

Oefeninstructies

  • Maak de Vandenberg-plot 'steelblue'.
  • Zet de rug plot-functionaliteit aan in de Vandenberg-plot.
  • Stel de kleur van de niet-Vandenberg-plot in op 'gray'.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

sns.kdeplot(pollution[pollution.city == 'Vandenberg Air Force Base'].O3, 
             label = 'Vandenberg',
             # Turn the color blue to stand out
             color = '____')

# Turn on rugplot
sns.____(pollution[pollution.city == 'Vandenberg Air Force Base'].O3, 
             label = 'Vandenberg',
             color = 'steelblue')

sns.kdeplot(pollution[pollution.city != 'Vandenberg Air Force Base'].O3,
             label = 'Other cities',
             # Turn the color gray
             color = '____')
plt.show()
Code bewerken en uitvoeren