ComeçarComece de graça

Operações com colunas - criando e renomeando colunas

O conjunto de dados census ainda não está mostrando exatamente tudo o que você quer. Vamos criar uma nova coluna sintética adicionando uma coluna baseada em colunas existentes e renomeá-la para dar mais clareza.

Lembre-se: já existe uma SparkSession chamada spark no seu ambiente de trabalho!

Este exercício faz parte do curso

Introdução ao PySpark

Ver curso

Instruções do exercício

  • Crie uma nova coluna, "weekly_salary", dividindo a coluna "income" por 52.
  • Renomeie a coluna "age" para "years".
  • Mostre o DataFrame resultante.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a new column 'weekly_salary'
census_df_weekly = census_df.____(____, ____)

# Rename the 'age' column to 'years'
census_df_weekly = ____.____(____, ____)

# Show the result
census_df_weekly.____
Editar e executar o código