Obter datetimes de várias colunas
Às vezes, dados de data e hora ficam divididos em colunas. Um conjunto de dados pode ter uma coluna de data e outra de hora, ou a data pode estar separada em ano, mês e dia.
Nesta versão dos dados da pesquisa, uma coluna foi dividida de modo que as datas estão em Part2StartDate e os horários em Part2StartTime. Sua tarefa é usar o argumento parse_dates de read_excel() para combiná-las em uma única coluna datetime com um novo nome.
O pandas já foi importado como pd.
Este exercício faz parte do curso
Ingestão de dados simplificada com pandas
Instruções do exercício
- Crie um dicionário,
datetime_cols, indicando que a nova colunaPart2Startdeve ser composta porPart2StartDateePart2StartTime. - Carregue o arquivo de respostas da pesquisa, passando o dicionário para o argumento
parse_datespara criar a nova colunaPart2Start. - Veja estatísticas resumidas sobre a nova coluna
Part2Startcom o métododescribe().
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create dict of columns to combine into new datetime column
datetime_cols = {"Part2Start": ____}
# Load file, supplying the dict to parse_dates
survey_data = pd.read_excel("fcc_survey_dts.xlsx",
____)
# View summary statistics about Part2Start
print(survey_data.Part2Start.describe())