Mulai sekarangMulai gratis

Creating a Categorical column

Back to the movie dataset from the streaming startup. Most rows in original_language use the same handful of codes (en, fr, es, …). Casting to Categorical encodes each unique label as an integer behind the scenes, saving memory on repeated strings.

Latihan ini merupakan bagian dari kursus

Scaling and Optimizing Data Pipelines with Polars

Lihat Kursus

Instruksi latihan

  • Cast the original_language column to pl.Categorical.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

movies_cat = movies.with_columns(
    # Cast to Categorical to save memory
    pl.col("original_language").____(pl.____)
)

result = movies_cat.select("movie_title", "original_language").head(8)
print(result)
Edit dan Jalankan Kode