Stel aggregatieniveau-Expectations op
Tijd om te oefenen met kolomspecifieke Expectations op aggregatieniveau. De Expectation Suite en de Batch zijn al toegewezen aan de variabelen suite en batch en geladen met de Shein Footwear-gegevensset. Great Expectations en pandas zijn beschikbaar als gx en pd.
Deze oefening maakt deel uit van de cursus
Kennismaking met Datakwaliteit met Great Expectations
Interactieve oefening met praktijkervaring
Probeer deze oefening door deze voorbeeldcode aan te vullen.
# "colour" should be in the set "Khaki", "Purple", or "Grey"
colour_expectation = gx.expectations.ExpectColumnDistinctValuesToBeInSet(
____="colour", value_set={"Khaki", "Purple", "Grey"}
)
# "seller_name" should have 7 to 10 distinct values
seller_expectation = gx.expectations.ExpectColumnUniqueValueCountToBeBetween(
column="seller_name", ____=7, ____=10
)
# "link" should have all unique values
link_expectation = gx.expectations.____(
column="link"
)
# "review_count" should have a most common value in the set "0" or "100+"
review_count_expectation = gx.expectations.ExpectColumnMostCommonValueToBeInSet(
column=____, value_set=____
)