1. Learn
  2. /
  3. 课程
  4. /
  5. Inżynieria cech dla NLP w Pythonie

Connected

道练习

Użycie rzeczowników w fałszywych wiadomościach

W tym ćwiczeniu masz do dyspozycji ramkę danych headlines zawierającą nagłówki wiadomości – zarówno fałszywych, jak i prawdziwych. Twoim zadaniem jest wygenerowanie dwóch nowych cech: num_propn i num_noun, które reprezentują liczbę nazw własnych oraz pozostałych rzeczowników zawartych w kolumnie title ramki headlines.

Następnie obliczymy średnią liczbę nazw własnych i pozostałych rzeczowników używanych w fałszywych i prawdziwych nagłówkach, a potem porównamy te wartości. Jeśli różnica będzie znacząca, istnieje duże prawdopodobieństwo, że użycie cech num_propn i num_noun w detektorach fałszywych wiadomości poprawi ich skuteczność.

Aby wykonać to zadanie, funkcje proper_nouns i nouns zbudowane w poprzednim ćwiczeniu są już dla ciebie dostępne.

说明 1/2

undefined XP
  • 1
    • Utwórz nową cechę num_propn, stosując funkcję proper_nouns do headlines['title'].
    • Przefiltruj headlines, aby obliczyć średnią liczbę nazw własnych w fałszywych wiadomościach, korzystając z metody mean.
  • 2
    • Powtórz ten proces dla pozostałych rzeczowników: utwórz cechę 'num_noun' za pomocą funkcji nouns i oblicz średnią liczbę pozostałych rzeczowników.