1. Nauka
  2. /
  3. Kursy
  4. /
  5. Inżynieria cech dla NLP w Pythonie

Connected

ćwiczenie

Liczba słów w przemówieniach TED

ted to ramka danych zawierająca transkrypcje 500 przemówień TED. Twoim zadaniem jest obliczenie nowej cechy word_count, która będzie zawierać przybliżoną liczbę słów w każdym przemówieniu. Następnie oblicz średnią liczbę słów we wszystkich przemówieniach. Transkrypcje są dostępne jako cecha transcript w ramce ted.

Aby wykonać to zadanie, zdefiniuj funkcję count_words, która przyjmuje ciąg znaków jako argument i zwraca liczbę słów w tym ciągu. Następnie zastosuj tę funkcję do kolumny transcript ramki ted, aby utworzyć nową cechę word_count, i oblicz jej średnią.

Instrukcje

100 XP
  • Podziel string na listę słów za pomocą metody split().
  • Zwróć liczbę elementów w words za pomocą len().
  • Zastosuj swoją funkcję do kolumny transcript ramki ted, aby utworzyć nową cechę word_count.
  • Oblicz średnią liczbę słów we wszystkich przemówieniach za pomocą mean().