Aan de slagGa gratis aan de slag

Finding gaps in both DataFrames

For data quality checks, you want to see all rows from both DataFrames - listings without benchmarks and benchmarks without listings. This helps identify gaps before analysis.

polars is loaded as pl, and the DataFrames hotels and type_benchmarks are available for you.

Deze oefening maakt deel uit van de cursus

Data Transformation with Polars

Cursus bekijken

Oefeninstructies

  • Join hotels with type_benchmarks on type and beach, keeping all rows from both DataFrames.
  • Use coalesce=True to avoid duplicate join columns.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Keep all rows from both DataFrames
full_view = hotels.____(
    type_benchmarks,
    on=["type", "beach"],
    how="____",
    # Avoid duplicate columns
    coalesce=____
)

print(full_view.head())
Code bewerken en uitvoeren