ComenzarEmpieza gratis

Obtén datetimes a partir de varias columnas

A veces, los datos de tipo datetime están repartidos en varias columnas. Un conjunto de datos puede tener una columna para la fecha y otra para la hora, o la fecha puede dividirse en columnas de año, mes y día.

En esta versión de los datos de la encuesta, una columna se ha dividido de modo que las fechas están en Part2StartDate y las horas en Part2StartTime. Tu tarea es usar el argumento parse_dates de read_excel() para combinarlas en una única columna datetime con un nombre nuevo.

Se ha importado pandas como pd.

Este ejercicio forma parte del curso

Ingesta de datos eficiente con pandas

Ver curso

Instrucciones del ejercicio

  • Crea un diccionario, datetime_cols, indicando que la nueva columna Part2Start debe componerse de Part2StartDate y Part2StartTime.
  • Carga el archivo de respuestas de la encuesta, pasando el diccionario al argumento parse_dates para crear la nueva columna Part2Start.
  • Consulta estadísticas resumidas sobre la nueva columna Part2Start con el método describe().

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create dict of columns to combine into new datetime column
datetime_cols = {"Part2Start": ____}


# Load file, supplying the dict to parse_dates
survey_data = pd.read_excel("fcc_survey_dts.xlsx",
                            ____)

# View summary statistics about Part2Start
print(survey_data.Part2Start.describe())
Editar y ejecutar código