Açıklayıcı kalalım
San Francisco Havalimanı’ndaki yolcu deneyimlerini daha iyi anlamak için, kalite güvence birimi tüm kategorilerde havalimanına en kötü puanı veren yolculara nitel bir anket gönderdi. Bu anketin amacı, yolcuların havalimanı hakkında söylediklerinde ortak kalıpları belirlemek.
Yanıtlar survey_response sütununda saklı. Daha yakından baktığında, bazı yanıtların pek bir şey söylemeden mümkün olan en kısa karakter sayısını verdiğini fark ettin. Bu egzersizde, karakter sayısı 40’tan büyük olan yanıtları ayıracaksın ve assert deyimi kullanarak yeni DataFrame’inin 40 veya daha fazla karakter içeren yanıtlar barındırdığından emin olacaksın.
airlines DataFrame’i ortamında mevcut ve pandas pd olarak içe aktarılmış durumda.
Bu egzersiz
Python ile Veri Temizleme
kursunun bir parçasıdırEgzersiz talimatları
airlinesDataFrame’ini kullanarak,survey_responsesütunundaki her bir yanıtın uzunluğunu.str.len()ile hesapla veresp_lengthiçinde sakla.resp_lengthdeğeri40’tan büyük olanairlinessatırlarını ayır.airlines_surveyiçindeki en küçüksurvey_responseuzunluğunun artık40’tan büyük olduğunuassertile doğrula.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Store length of each row in survey_response column
resp_length = ____
# Find rows in airlines where resp_length > 40
airlines_survey = airlines[____ > ____]
# Assert minimum survey_response length is > 40
assert ____.str.len().____ > _____
# Print new survey_response column
print(airlines_survey['survey_response'])