Obtén datetimes a partir de varias columnas
A veces, los datos de tipo datetime están repartidos en varias columnas. Un conjunto de datos puede tener una columna para la fecha y otra para la hora, o la fecha puede dividirse en columnas de año, mes y día.
En esta versión de los datos de la encuesta, una columna se ha dividido de modo que las fechas están en Part2StartDate y las horas en Part2StartTime. Tu tarea es usar el argumento parse_dates de read_excel() para combinarlas en una única columna datetime con un nombre nuevo.
Se ha importado pandas como pd.
Este ejercicio forma parte del curso
Ingesta de datos eficiente con pandas
Instrucciones del ejercicio
- Crea un diccionario,
datetime_cols, indicando que la nueva columnaPart2Startdebe componerse dePart2StartDateyPart2StartTime. - Carga el archivo de respuestas de la encuesta, pasando el diccionario al argumento
parse_datespara crear la nueva columnaPart2Start. - Consulta estadísticas resumidas sobre la nueva columna
Part2Startcon el métododescribe().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create dict of columns to combine into new datetime column
datetime_cols = {"Part2Start": ____}
# Load file, supplying the dict to parse_dates
survey_data = pd.read_excel("fcc_survey_dts.xlsx",
____)
# View summary statistics about Part2Start
print(survey_data.Part2Start.describe())