1. Learn
  2. /
  3. 课程
  4. /
  5. Python 数据清洗

Connected

道练习

保持描述性

为进一步了解旅客在旧金山机场的体验,质量保证部门向在所有可能的类别中都给出最低分的旅客发送了一份定性问卷。该问卷的目标是找出旅客对机场评价中的共性模式。

他们的回答存储在 survey_response 列中。仔细查看后,您发现有些答案几乎没有实质内容,只给了最短的字符数。在本练习中,您将筛选出字符数大于 40 的回复,并使用 assert 语句确保新的 DataFrame 中仅包含长度为 40 个字符或更多的回复。

airlines DataFrame 已在您的环境中,且已将 pandas 以 pd 导入。

说明

100 XP
  • 使用 airlines DataFrame,将 survey_response 列中每个条目的长度通过 .str.len() 存入 resp_length。
  • 筛选出 airlines 中 resp_length 大于 40 的行。
  • 断言 airlines_survey 中最短的 survey_response 长度现在大于 40。