Media móvil de 360 días y desviación típica de los datos de ozono en Nueva York desde 2000
El último vídeo también mostraba cómo calcular varias estadísticas rodantes utilizando el método .agg(), similar a .groupby().
Echemos un vistazo más de cerca a la historia de la calidad del aire de NYC utilizando los datos de ozono que ha visto antes. Los datos diarios son muy volátiles, por lo que utilizar una media móvil a más largo plazo puede ayudar a revelar una tendencia a más largo plazo.
Utilizarás una ventana móvil de 360 días y .agg() para calcular la media móvil y la desviación estándar de los valores medios diarios de ozono desde el año 2000.
Este ejercicio forma parte del curso
Manipulación de datos de series temporales en Python
Instrucciones del ejercicio
Ya hemos importado pandas como pd, y matplotlib.pyplot como plt.
- Utilice
pd.read_csv()para importar'ozone.csv', creando unDateTimeIndexa partir de la columna'date'utilizandoparse_datesyindex_col, asigne el resultado adata, y elimine los valores que faltan utilizando.dropna(). - Seleccione la columna
'Ozone'y cree una ventana.rolling()utilizando 360 periodos, aplique.agg()para calcular losmeanystd, y asígnelos arolling_stats. - Utilice
.join()para concatenardataconrolling_stats, y asigne astats. - Trace
statsutilizandosubplots.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Import and inspect ozone data here
data = ____
# Calculate the rolling mean and std here
rolling_stats = ____
# Join rolling_stats with ozone data
stats = ____
# Plot stats