Evidenziare con hardcoding
Stai collaborando con la città di Houston per analizzare la relazione tra l’inquinamento da anidride solforosa (SO2) e biossido di azoto (NO2), in particolare per l’anno più recente in cui sono stati raccolti i dati (2014). Hai individuato una giornata particolarmente negativa, il 26 novembre, in cui c’è stato un forte picco dei livelli di SO2. Per attirare l’attenzione degli utenti su questo giorno critico, lo evidenzierai con un arancione-rossastro brillante e colorerai in grigio il resto dei punti.
pandas, matplotlib.pyplot e seaborn sono già caricate come pd, plt e sns, rispettivamente, e saranno disponibili nel tuo workspace per tutto il resto del corso.
Questo corso tocca molti concetti che potresti aver dimenticato; se ti serve un rapido ripasso, scarica la Seaborn Cheat Sheet e tienila a portata di mano!
Questo esercizio fa parte del corso
Migliorare le tue visualizzazioni dei dati in Python
Istruzioni dell'esercizio
- Modifica la list comprehension per colorare di
orangeredil valore corrispondente al 330ºday(26 novembre) dell’year2014 e dilightgraytutti gli altri punti. - Passa l’array
houston_colorsaregplot()usando l’argomentoscatter_kwsper colorare i punti.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
houston_pollution = pollution[pollution.city == 'Houston']
# Make array orangred for day 330 of year 2014, otherwise lightgray
houston_colors = ['orangered' if (____ == 330) & (____ == 2014) else 'lightgray'
for day,year in zip(houston_pollution.____, houston_pollution.____)]
sns.regplot(x = 'NO2',
y = 'SO2',
data = houston_pollution,
fit_reg = False,
# Send scatterplot argument to color points
scatter_kws = {'facecolors': ____, 'alpha': 0.7})
plt.show()