ComeçarComece de graça

Obter datetimes de várias colunas

Às vezes, dados de data e hora ficam divididos em colunas. Um conjunto de dados pode ter uma coluna de data e outra de hora, ou a data pode estar separada em ano, mês e dia.

Nesta versão dos dados da pesquisa, uma coluna foi dividida de modo que as datas estão em Part2StartDate e os horários em Part2StartTime. Sua tarefa é usar o argumento parse_dates de read_excel() para combiná-las em uma única coluna datetime com um novo nome.

O pandas já foi importado como pd.

Este exercício faz parte do curso

Ingestão de dados simplificada com pandas

Ver curso

Instruções do exercício

  • Crie um dicionário, datetime_cols, indicando que a nova coluna Part2Start deve ser composta por Part2StartDate e Part2StartTime.
  • Carregue o arquivo de respostas da pesquisa, passando o dicionário para o argumento parse_dates para criar a nova coluna Part2Start.
  • Veja estatísticas resumidas sobre a nova coluna Part2Start com o método describe().

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create dict of columns to combine into new datetime column
datetime_cols = {"Part2Start": ____}


# Load file, supplying the dict to parse_dates
survey_data = pd.read_excel("fcc_survey_dts.xlsx",
                            ____)

# View summary statistics about Part2Start
print(survey_data.Part2Start.describe())
Editar e executar o código