1. Nauka
  2. /
  3. Kursy
  4. /
  5. Wyrażenia regularne w Pythonie

Connected

ćwiczenie

Parsowanie plików PDF

Czas zająć się kolejnym małym projektem, który odkładałeś na później. Firma przekazała ci kilka plików PDF z podpisanymi umowami. Celem projektu jest stworzenie bazy danych z informacjami wyodrębnionymi z tych plików. Trzy kolumny powinny odpowiadać dniu, miesiącowi i rokowi podpisania umowy.
Daty mają format Signed on 05/24/2016 (05 oznacza miesiąc, 24 – dzień). Postanawiasz użyć grup przechwytujących, aby wyodrębnić te informacje, a następnie zapisać je osobno w różnych zmiennych.

Na początek wykonasz test koncepcji.

Zmienna contract zawierająca tekst jednej umowy oraz moduł re są już załadowane w sesji. Możesz użyć funkcji print(), aby wyświetlić dane w powłoce IPython.

Instrukcje 1/3

undefined XP
    1
    2
    3
  • Napisz wyrażenie regularne, które przechwyci miesiąc, dzień i rok podpisania umowy (contract). Przeszukaj zmienną contract w poszukiwaniu dopasowań.