ComenzarEmpieza gratis

Cortar series temporales

La segmentación es especialmente útil para las series temporales, ya que es habitual querer filtrar los datos dentro de un intervalo de fechas. Añade la columna date al índice y utiliza .loc[] para realizar el subconjunto. Lo importante es recordar que debes mantener tus fechas en formato ISO 8601, es decir, "yyyy-mm-dd" para año-mes-día, "yyyy-mm" para año-mes y "yyyy" para año.

Recuerda del Capítulo 1 que puedes combinar varias condiciones booleanas utilizando operadores lógicos, como &. Para hacerlo en una línea de código, tendrás que añadir paréntesis () alrededor de cada condición.

pandas se carga como pd y temperatures, sin índice, está disponible.

Este ejercicio forma parte del curso

Manipulación de datos con pandas

Ver curso

Instrucciones de ejercicio

  • Utiliza condiciones booleanas, no .isin() ni .loc[], y la fecha completa "yyyy-mm-dd", para subconjuntar temperatures para las filas en las que la columna date esté en 2010 y 2011 e imprime los resultados.
  • Establece el índice de temperatures en la columna date y ordénala.
  • Utiliza .loc[] para subconjuntar temperatures_ind para las filas de 2010 y 2011.
  • Utiliza .loc[] para subconjuntar temperatures_ind para las filas de August 2010 a February 2011.

Ejercicio interactivo práctico

Pruebe este ejercicio completando este código de muestra.

# Use Boolean conditions to subset temperatures for rows in 2010 and 2011
temperatures_bool = ____[(____ >= ____) & (____ <= ____)]
print(temperatures_bool)

# Set date as the index and sort the index
temperatures_ind = temperatures.____.____

# Use .loc[] to subset temperatures_ind for rows in 2010 and 2011
print(____)

# Use .loc[] to subset temperatures_ind for rows from Aug 2010 to Feb 2011
print(____)
Editar y ejecutar código