Cortar series temporales
La segmentación es especialmente útil para las series temporales, ya que es habitual querer filtrar los datos dentro de un intervalo de fechas. Añade la columna date
al índice y utiliza .loc[]
para realizar el subconjunto. Lo importante es recordar que debes mantener tus fechas en formato ISO 8601, es decir, "yyyy-mm-dd"
para año-mes-día, "yyyy-mm"
para año-mes y "yyyy"
para año.
Recuerda del Capítulo 1 que puedes combinar varias condiciones booleanas utilizando operadores lógicos, como &
. Para hacerlo en una línea de código, tendrás que añadir paréntesis ()
alrededor de cada condición.
pandas
se carga como pd
y temperatures
, sin índice, está disponible.
Este ejercicio forma parte del curso
Manipulación de datos con pandas
Instrucciones de ejercicio
- Utiliza condiciones booleanas, no
.isin()
ni.loc[]
, y la fecha completa"yyyy-mm-dd"
, para subconjuntartemperatures
para las filas en las que la columnadate
esté en 2010 y 2011 e imprime los resultados. - Establece el índice de
temperatures
en la columnadate
y ordénala. - Utiliza
.loc[]
para subconjuntartemperatures_ind
para las filas de 2010 y 2011. - Utiliza
.loc[]
para subconjuntartemperatures_ind
para las filas de August 2010 a February 2011.
Ejercicio interactivo práctico
Pruebe este ejercicio completando este código de muestra.
# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)
# Set date as the index and sort the index
temperatures_ind = temperatures.____.____
# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)
# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)