Operações com colunas - criando e renomeando colunas
O conjunto de dados census ainda não está mostrando exatamente tudo o que você quer. Vamos criar uma nova coluna sintética adicionando uma coluna baseada em colunas existentes e renomeá-la para dar mais clareza.
Lembre-se: já existe uma SparkSession chamada spark no seu ambiente de trabalho!
Este exercicio faz parte do curso
Introdução ao PySpark
Instruções do exercicio
- Crie uma nova coluna,
"weekly_salary", dividindo a coluna"income"por 52. - Renomeie a coluna
"age"para"years". - Mostre o DataFrame resultante.
exercicio interativo prático
Tente este exercicio completando este código de exemplo.
# Create a new column 'weekly_salary'
census_df_weekly = census_df.____(____, ____)
# Rename the 'age' column to 'years'
census_df_weekly = ____.____(____, ____)
# Show the result
census_df_weekly.____