Menyusun Expectations tingkat agregat
Saatnya berlatih menulis beberapa Expectation khusus kolom pada tingkat agregat. Expectation Suite dan Batch masing-masing sudah ditetapkan ke variabel suite dan batch, serta dimuat dengan himpunan data Shein Footwear. Great Expectations dan pandas tersedia sebagai gx dan pd.
Latihan ini adalah bagian dari kursus
Pengantar Data Quality dengan Great Expectations
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# "colour" should be in the set "Khaki", "Purple", or "Grey"
colour_expectation = gx.expectations.ExpectColumnDistinctValuesToBeInSet(
____="colour", value_set={"Khaki", "Purple", "Grey"}
)
# "seller_name" should have 7 to 10 distinct values
seller_expectation = gx.expectations.ExpectColumnUniqueValueCountToBeBetween(
column="seller_name", ____=7, ____=10
)
# "link" should have all unique values
link_expectation = gx.expectations.____(
column="link"
)
# "review_count" should have a most common value in the set "0" or "100+"
review_count_expectation = gx.expectations.ExpectColumnMostCommonValueToBeInSet(
column=____, value_set=____
)