Programmeerbaar een highlight maken
Je gaat verder met je werk voor de stad Houston. Nu wil je kijken naar het gedrag van zowel NO2 als SO2 wanneer de niet-geplotte ozonwaarde (O3) op zijn hoogst was.
Vervang hiervoor de logica in de huidige list comprehension door een vergelijking tussen de O3-waarde van een rij en de hoogste waargenomen O3 in de gegevensset. Let op: gebruik sns.scatterplot() in plaats van sns.regplot(). Dit is omdat sns.scatterplot() een niet-kleurvector als hue-argument kan aannemen en de punten automatisch inkleurt, met daarbij een handige legenda.
Deze oefening maakt deel uit van de cursus
Je datavisualisaties verbeteren in Python
Oefeninstructies
- Zoek de waarde die overeenkomt met de hoogste waargenomen
O3-waarde in de DataFramehouston_pollution. Let erop dat je de letterOtypt en niet het cijfer nul! - Voeg de kolom
'point_type'toe aan de DataFramehouston_pollutionom aan te geven of de rij de hoogste waargenomen O3 bevat. - Geef deze nieuw gemaakte kolom door aan het
hue-argument vansns.scatterplot()om de punten in te kleuren.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
houston_pollution = pollution[pollution.city == 'Houston'].copy()
# Find the highest observed O3 value
max_O3 = houston_pollution.O3.____
# Make a column that denotes which day had highest O3
houston_pollution['____'] = ['Highest O3 Day' if ____ == ____ else 'Others' for O3 in houston_pollution.O3]
# Encode the hue of the points with the O3 generated column
sns.scatterplot(x = 'NO2',
y = 'SO2',
hue = '____',
data = houston_pollution)
plt.show()