1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wyrażenia regularne w Pythonie

Connected

ćwiczenie

Czy to boty?

Firma, w której pracujesz, poprosiła cię o przeprowadzenie analizy sentymentu na zbiorze danych z tweetami. Na początek musisz oczyścić dane i wyodrębnić pewne informacje.
Przeglądając teksty tweetów, zauważasz, że niektóre z nich zawierają wzmianki o użytkownikach. Część tych wzmianek ma bardzo dziwny wzorzec. Oto kilka przykładów: @robot3!, @robot5& i @robot7#

Aby sprawdzić, czy ci użytkownicy to boty, wykonasz test koncepcji na jednym tweecie i wyodrębnisz te wzmianki za pomocą metody .findall().

Zapisujesz kilka przydatnych metaznaków na później:

\d: cyfra
\w: znak słowny
\W: znak niebędący znakiem słownym
\s: biały znak

Tekst jednego tweeta został zapisany w zmiennej sentiment_analysis. Możesz użyć print(sentiment_analysis), aby wyświetlić go w powłoce IPython.

Instrukcje

100 XP
  • Zaimportuj moduł re.
  • Napisz wyrażenie regularne, które dopasowuje wzmianki o użytkownikach zaczynające się od @ i zgodne z wzorcem, np. @robot3!.
  • Znajdź wszystkie dopasowania wzorca w zmiennej sentiment_analysis.