Tetap deskriptif
Untuk lebih memahami pengalaman pelancong di Bandara San Francisco, tim penjaminan mutu mengirimkan kuesioner kualitatif kepada semua pelancong yang memberikan nilai terburuk untuk semua kategori yang mungkin. Tujuan dari kuesioner ini adalah mengidentifikasi pola umum dalam apa yang dikatakan pelancong tentang bandara tersebut.
Tanggapan mereka disimpan dalam kolom survey_response. Setelah ditelaah, Anda menyadari beberapa jawaban menggunakan jumlah karakter paling sedikit tanpa banyak substansi. Dalam latihan ini, Anda akan mengisolasi tanggapan dengan jumlah karakter lebih dari 40, dan memastikan DataFrame baru Anda berisi tanggapan dengan 40 karakter atau lebih menggunakan pernyataan assert.
DataFrame airlines sudah tersedia di lingkungan Anda, dan pandas telah diimpor sebagai pd.
Latihan ini merupakan bagian dari kursus
Membersihkan Data di Python
Instruksi latihan
- Dengan menggunakan DataFrame
airlines, simpan panjang setiap entri pada kolomsurvey_responsekeresp_lengthdengan.str.len(). - Isolasi baris
airlinesdenganresp_lengthlebih dari40. - Lakukan assert bahwa panjang
survey_responseterkecil diairlines_surveysekarang lebih besar dari40.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Store length of each row in survey_response column
resp_length = ____
# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]
# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____
# Print new survey_response column
print(airlines_survey['survey_response'])