1. Дізнатися
  2. /
  3. Courses
  4. /
  5. Очищення даних у Python

Connected

exercise

Залишайтеся змістовними

Щоб краще зрозуміти враження мандрівників в аеропорту Сан-Франциско, відділ контролю якості надіслав якісну анкету всім пасажирам, які поставили аеропорту найгіршу оцінку за всіма можливими категоріями. Мета цієї анкети — виявити спільні закономірності у висловлюваннях пасажирів про аеропорт.

Їхні відповіді збережено в стовпці survey_response. Ретельніше придивившись, ви помітили, що деякі респонденти дали найкоротші можливі відповіді без суттєвого змісту. У цій вправі ви ізолюєте відповіді з кількістю символів більшою за 40, а також переконаєтеся, що ваш новий датафрейм містить відповіді з 40 символів або більше, використовуючи оператор assert.

Датафрейм airlines є у вашому середовищі, а pandas імпортовано як pd.

Інструкції

100 XP
  • Використовуючи датафрейм airlines, збережіть довжину кожного елемента у стовпці survey_response в resp_length, застосувавши .str.len().
  • Відіберіть рядки airlines, де resp_length більша за 40.
  • Переконайтеся за допомогою assert, що найменша довжина survey_response у airlines_survey тепер більша за 40.