|2022-05-23| artykuł sponsorowany |
Geodezja, Software
Automatyczna ekstrakcja danych i anonimizacja dokumentów
Cyfryzacja danych i procesów w administracji publicznej, mimo pewnych zastrzeżeń co do szczegółów, odnotowała w ostatnich kilkunastu latach ogromny postęp. Jako grupa zawodowa znaleźliśmy się szczególnie blisko tej transformacji – z jednej strony jako jej wykonawcy, z drugiej jako beneficjenci. W związku z powyższym czujemy się uprawnieni do jej oceny.
Prawdopodobnie najpowszechniejszym grzechem było uczynienie celem cyfryzacji samego „przeniesienia procesu do komputera”, a nie usprawnienie go zarówno z punktu widzenia korzystającego z niego obywatela, jak i obsługującego urzędnika. Drugim niedostatkiem transformacji cyfrowej, jaki obserwujemy, jest powstanie „analogowych dziur”. Są to obszary, w których przepływ danych między procesami lub między obywatelem i urzędem ma charakter analogowy lub też nawet cyfrowy, ale niestrukturalny (np. przesyłanie skanowanych dokumentów pomiędzy urzędami). Po części przyczyną takiej sytuacji jest chęć zapobiegania wykluczeniu cyfrowemu obywateli, ale po części również wyspowy charakter systemów obsługujących poszczególne procesy. Taki stan rzeczy prowadzi do niepotrzebnego wzrostu nakładu pracy w wyniku konieczności ponownego wprowadzenia (często wcześniej cyfrowych) danych do systemu informatycznego.
Poczynienie takiej obserwacji sprowokowało nas do wykorzystania technologii opartych na algorytmach sztucznej inteligencji – opracowanych w ramach współfinansowanego przez NCBiR projektu „Baza Wiedzy o Nieruchomościach” – do niwelacji tych „analogowych dziur”. Od kilku lat z powodzeniem wdrażamy nasze narzędzia do automatyzacji ekstrakcji danych z takich dokumentów, jak: akty notarialne, zawiadomienia, operaty techniczne, decyzje administracyjne i inne. Pozyskane w ten sposób dane wspomagają zasilanie istniejących systemów, wspierając takie procesy, jak dekretacja dokumentów, obsługa prawa pierwokupu, obsługa płatności za wyłączenie gruntów z produkcji rolnej czy wprowadzanie zmian w ewidencji gruntów i budynków.
Automatyczna ekstrakcja danych wymaga lokalizacji, kategoryzacji i odczytania danych znajdujących się na skanach dokumentów. Mając takie informacje, można również w sposób automatyczny dokonać anonimizacji źródłowego dokumentu poprzez zamazanie określonej kategorii danych (np.: imion i nazwisk, nr PESEL, KW czy działek). Narzędzie takie, już obecnie, część z naszych klientów wdrożyło w celu obsługi procesu dostępu do danych publicznych.
W związku z pismem p.o. GGK dotyczącym konieczności anonimizacji danych osobowych znajdujących się na opisach topograficznych informujemy, iż Instytut posiada obecnie w swojej ofercie narzędzie do całkowicie automatycznego wykonania tej czynności. Narzędzie może funkcjonować w sposób niezależny lub może być zintegrowane z wykorzystywanymi systemami do prowadzenia ośrodka. Integracja naszego narzędzia z bardzo popularnym systemem Geo-Info firmy Systherm została już przeprowadzona w ponad 10 ośrodkach.
Zainteresowanych automatyzacją ekstrakcji danych z dokumentów oraz ich anonimizacją zapraszamy do kontaktu z Instytutem pod adresem: biuro@wizipisi.pl
Źródło: WIZIPiSI
|