Aan de slagGa gratis aan de slag

Programmeerbaar een highlight maken

Je gaat verder met je werk voor de stad Houston. Nu wil je kijken naar het gedrag van zowel NO2 als SO2 wanneer de niet-geplotte ozonwaarde (O3) op zijn hoogst was.

Vervang hiervoor de logica in de huidige list comprehension door een vergelijking tussen de O3-waarde van een rij en de hoogste waargenomen O3 in de gegevensset. Let op: gebruik sns.scatterplot() in plaats van sns.regplot(). Dit is omdat sns.scatterplot() een niet-kleurvector als hue-argument kan aannemen en de punten automatisch inkleurt, met daarbij een handige legenda.

Deze oefening maakt deel uit van de cursus

Je datavisualisaties verbeteren in Python

Cursus bekijken

Oefeninstructies

  • Zoek de waarde die overeenkomt met de hoogste waargenomen O3-waarde in de DataFrame houston_pollution. Let erop dat je de letter O typt en niet het cijfer nul!
  • Voeg de kolom 'point_type' toe aan de DataFrame houston_pollution om aan te geven of de rij de hoogste waargenomen O3 bevat.
  • Geef deze nieuw gemaakte kolom door aan het hue-argument van sns.scatterplot() om de punten in te kleuren.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

houston_pollution = pollution[pollution.city  ==  'Houston'].copy()

# Find the highest observed O3 value
max_O3 = houston_pollution.O3.____

# Make a column that denotes which day had highest O3
houston_pollution['____'] = ['Highest O3 Day' if ____  ==  ____ else 'Others' for O3 in houston_pollution.O3]

# Encode the hue of the points with the O3 generated column
sns.scatterplot(x = 'NO2',
                y = 'SO2',
                hue = '____',
                data = houston_pollution)
plt.show()
Code bewerken en uitvoeren