Media móvil de 360 días y desviación típica de los datos de ozono en Nueva York desde 2000
El último vídeo también mostraba cómo calcular varias estadísticas rodantes utilizando el método .agg()
, similar a .groupby()
.
Echemos un vistazo más de cerca a la historia de la calidad del aire de NYC utilizando los datos de ozono que ha visto antes. Los datos diarios son muy volátiles, por lo que utilizar una media móvil a más largo plazo puede ayudar a revelar una tendencia a más largo plazo.
Utilizarás una ventana móvil de 360 días y .agg()
para calcular la media móvil y la desviación estándar de los valores medios diarios de ozono desde el año 2000.
Este ejercicio forma parte del curso
Manipulación de datos de series temporales en Python
Instrucciones del ejercicio
Ya hemos importado pandas
como pd
, y matplotlib.pyplot
como plt
.
- Utilice
pd.read_csv()
para importar'ozone.csv'
, creando unDateTimeIndex
a partir de la columna'date'
utilizandoparse_dates
yindex_col
, asigne el resultado adata
, y elimine los valores que faltan utilizando.dropna()
. - Seleccione la columna
'Ozone'
y cree una ventana.rolling()
utilizando 360 periodos, aplique.agg()
para calcular losmean
ystd
, y asígnelos arolling_stats
. - Utilice
.join()
para concatenardata
conrolling_stats
, y asigne astats
. - Trace
stats
utilizandosubplots
.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import and inspect ozone data here
data = ____
# Calculate the rolling mean and std here
rolling_stats = ____
# Join rolling_stats with ozone data
stats = ____
# Plot stats