Stel aggregatieniveau-Expectations op
Tijd om te oefenen met kolomspecifieke Expectations op aggregatieniveau. De Expectation Suite en de Batch zijn al toegewezen aan de variabelen suite en batch en geladen met de Shein Footwear-gegevensset. Great Expectations en pandas zijn beschikbaar als gx en pd.
Deze oefening maakt deel uit van de cursus
Kennismaking met Datakwaliteit met Great Expectations
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# "colour" should be in the set "Khaki", "Purple", or "Grey"
colour_expectation = gx.expectations.ExpectColumnDistinctValuesToBeInSet(
____="colour", value_set={"Khaki", "Purple", "Grey"}
)
# "seller_name" should have 7 to 10 distinct values
seller_expectation = gx.expectations.ExpectColumnUniqueValueCountToBeBetween(
column="seller_name", ____=7, ____=10
)
# "link" should have all unique values
link_expectation = gx.expectations.____(
column="link"
)
# "review_count" should have a most common value in the set "0" or "100+"
review_count_expectation = gx.expectations.ExpectColumnMostCommonValueToBeInSet(
column=____, value_set=____
)