1. Learn
  2. /
  3. Courses
  4. /
  5. Очищення даних у Python

Connected

Exercise

Додавання рядків і конкатенація чисел

У попередній вправі ви визначили, що category — коректний тип даних для user_type, і перетворили його, щоб отримати релевантні статистичні підсумки, які показують розподіл user_type.

Ще одна поширена проблема з типами даних — коли значення, що мають бути числовими, імпортуються як рядки: математичні операції на кшталт додавання чи множення в такому разі призводять до конкатенації рядків, а не до числових результатів.

У цій вправі ви перетворите рядковий стовпець duration на тип int. Перед цим потрібно прибрати "minutes" зі стовпця, щоб pandas розпізнав його як числовий. Пакет pandas вже імпортовано як pd.

Instructions

100 XP
  • Використайте метод .strip(), щоб прибрати з duration "minutes", і збережіть результат у стовпці duration_trim.
  • Перетворіть duration_trim на int і збережіть у стовпці duration_time.
  • Напишіть оператор assert, який перевіряє, що tип даних у duration_time тепер int.
  • Виведіть середню тривалість поїздки.