Operaciones con columnas: crear y renombrar columnas
El conjunto de datos census todavía no muestra exactamente todo lo que quieres. Vamos a crear una columna sintética añadiendo una columna nueva basada en columnas existentes y a renombrarla para que sea más clara.
Recuerda: ¡ya tienes una SparkSession llamada spark en tu espacio de trabajo!
Este ejercicio forma parte del curso
Introducción a PySpark
Instrucciones del ejercicio
- Crea una nueva columna,
"weekly_salary", dividiendo la columna"income"entre 52. - Cambia el nombre de la columna
"age"a"years". - Muestra el DataFrame resultante.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a new column 'weekly_salary'
census_df_weekly = census_df.____(____, ____)
# Rename the 'age' column to 'years'
census_df_weekly = ____.____(____, ____)
# Show the result
census_df_weekly.____