1. 学ぶ
  2. /
  3. コース
  4. /
  5. Inżynieria cech dla NLP w Pythonie

Connected

演習

Liczba znaków w rosyjskich tweetach

W tym ćwiczeniu otrzymujesz ramkę danych tweets zawierającą tweety powiązane z rosyjską Agencją Badań Internetowych, opracowane przez FiveThirtyEight.

Twoim zadaniem jest utworzenie nowej cechy 'char_count' w tweets, która oblicza liczbę znaków w każdym tweecie. Oblicz też średnią długość tweeta. Tweety są dostępne w cesze content ramki tweets.

Pamiętaj, że są to prawdziwe dane z Twittera – istnieje ryzyko, że mogą zawierać wulgaryzmy lub inne treści obraźliwe (dotyczy to tego ćwiczenia oraz kolejnych, które również korzystają z rzeczywistych danych z Twittera).

指示

100 XP
  • Utwórz nową cechę char_count, stosując len do cechy 'content' ramki tweets.
  • Wyświetl średnią liczbę znaków w tweetach, obliczając średnią z cechy 'char_count'.