ComenzarEmpieza gratis

Eliminar un DataFrame de la caché

Has terminado las tareas de análisis con el Marco de Datos salidas_df, pero te queda algún otro procesamiento por hacer. Te gustaría eliminar el DataFrame de la caché para evitar un uso excesivo de memoria en tu cluster.

El DataFrame departures_df está definido y ya se ha almacenado en caché para ti.

Este ejercicio forma parte del curso

Limpiar datos con PySpark

Ver curso

Instrucciones del ejercicio

  • Comprueba el estado de la caché en el DataFrame departures_df.
  • Elimina el DataFrame departures_df de la caché.
  • Valida de nuevo el estado de la caché.

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Determine if departures_df is in the cache
print("Is departures_df cached?: %s" % departures_df.____)
print("Removing departures_df from cache")

# Remove departures_df from the cache
____

# Check the cache status again
print("Is departures_df cached?: %s" % ____)
Editar y ejecutar código