Comece agoraComece grátis

Creating a Categorical column

Back to the movie dataset from the streaming startup. Most rows in original_language use the same handful of codes (en, fr, es, …). Casting to Categorical encodes each unique label as an integer behind the scenes, saving memory on repeated strings.

Este exercicio faz parte do curso

Scaling and Optimizing Data Pipelines with Polars

Ver curso

Instruções do exercicio

  • Cast the original_language column to pl.Categorical.

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

movies_cat = movies.with_columns(
    # Cast to Categorical to save memory
    pl.col("original_language").____(pl.____)
)

result = movies_cat.select("movie_title", "original_language").head(8)
print(result)
Editar e Executar Código