Operações com colunas - criando e renomeando colunas
O conjunto de dados census ainda não está mostrando exatamente tudo o que você quer. Vamos criar uma nova coluna sintética adicionando uma coluna baseada em colunas existentes e renomeá-la para dar mais clareza.
Lembre-se: já existe uma SparkSession chamada spark no seu ambiente de trabalho!
Este exercício faz parte do curso
Introdução ao PySpark
Instruções do exercício
- Crie uma nova coluna,
"weekly_salary", dividindo a coluna"income"por 52. - Renomeie a coluna
"age"para"years". - Mostre o DataFrame resultante.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a new column 'weekly_salary'
census_df_weekly = census_df.____(____, ____)
# Rename the 'age' column to 'years'
census_df_weekly = ____.____(____, ____)
# Show the result
census_df_weekly.____