1. 学ぶ
  2. /
  3. コース
  4. /
  5. Wyrażenia regularne w Pythonie

Connected

演習

Różnica między zachłannym a leniwym dopasowaniem

Musisz kontynuować czyszczenie zbioru danych z tweetami. Okazuje się, że niektóre tweety zawierają tagi HTML. Trzeba je usunąć, zachowując jednak treść wewnątrz – jest ona potrzebna do analizy.

Przyjrzyj się temu zdaniu z tagiem HTML:

I want to see that <strong>amazing show</strong> again!.

Wiesz, że aby dopasować tag HTML, musisz znaleźć wszystko, co znajduje się wewnątrz nawiasów ostrych < >. Największy problem polega na tym, że tag zamykający ma tę samą strukturę. Jeśli dopasowanie będzie zbyt szerokie, usuniesz ważne informacje. Musisz więc zdecydować, czy użyć zachłannego, czy leniwego kwantyfikatora.

Zmienna string jest już załadowana do twojej sesji.

指示

100 XP
  • Zaimportuj moduł re.
  • Napisz wyrażenie regex, które zastąpi tagi HTML pustym ciągiem znaków.
  • Wydrukuj wynik.