Inizia subitoInizia gratis

Creating a Categorical column

Back to the movie dataset from the streaming startup. Most rows in original_language use the same handful of codes (en, fr, es, …). Casting to Categorical encodes each unique label as an integer behind the scenes, saving memory on repeated strings.

Questo esercizio fa parte del corso

Scaling and Optimizing Data Pipelines with Polars

Visualizza corso

Istruzioni dell'esercizio

  • Cast the original_language column to pl.Categorical.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

movies_cat = movies.with_columns(
    # Cast to Categorical to save memory
    pl.col("original_language").____(pl.____)
)

result = movies_cat.select("movie_title", "original_language").head(8)
print(result)
Modifica ed esegui il codice