Tetap deskriptif
Untuk lebih memahami pengalaman pelancong di Bandara San Francisco, tim penjaminan mutu mengirimkan kuesioner kualitatif kepada semua pelancong yang memberikan nilai terburuk untuk semua kategori yang mungkin. Tujuan dari kuesioner ini adalah mengidentifikasi pola umum dalam apa yang dikatakan pelancong tentang bandara tersebut.
Tanggapan mereka disimpan dalam kolom survey_response. Setelah ditelaah, Anda menyadari beberapa jawaban menggunakan jumlah karakter paling sedikit tanpa banyak substansi. Dalam latihan ini, Anda akan mengisolasi tanggapan dengan jumlah karakter lebih dari 40, dan memastikan DataFrame baru Anda berisi tanggapan dengan 40 karakter atau lebih menggunakan pernyataan assert.
DataFrame airlines sudah tersedia di lingkungan Anda, dan pandas telah diimpor sebagai pd.
Latihan ini adalah bagian dari kursus
Membersihkan Data di Python
Petunjuk latihan
- Dengan menggunakan DataFrame
airlines, simpan panjang setiap entri pada kolomsurvey_responsekeresp_lengthdengan.str.len(). - Isolasi baris
airlinesdenganresp_lengthlebih dari40. - Lakukan assert bahwa panjang
survey_responseterkecil diairlines_surveysekarang lebih besar dari40.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Store length of each row in survey_response column
resp_length = ____
# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]
# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____
# Print new survey_response column
print(airlines_survey['survey_response'])