Jeśli prowadzisz firmę, w której na co dzień pojawia się dużo różnego rodzaju dokumentów, z pewnością wiesz, jak czasochłonna potrafi być ich archiwizacja. Czy da się przyspieszyć ten proces? Jak najbardziej! Przeczytaj, dlaczego przenoszenie treści rozpoznanych słów i znaków do pamięci cyfrowej ma znaczenie i kiedy warto zdecydować się na program do OCR.
Dlaczego system OCR jest istotny?
Szacuje się, że przeciętna szybkość pisania na klawiaturze osoby dorosłej to około 40 słów na minutę. Za wysoką produktywność uznaje się tempo 65-70 słów na minutę. Weź jednak pod uwagę, że te dane odnoszą się do tekstu pisanego „ciągiem”, czyli ze słuchu lub innego źródła. A co w sytuacji, kiedy niezbędne dane trzeba zlokalizować na formularzu, a następnie przenieść w odpowiednie okno innego programu, np. software’u przeznaczonego do obsługi księgowości? Oczywiście tempo takiej pracy znacząco spada. Niestety skanowanie dokumentu nie pomaga, ponieważ warstwa tekstowa zlewa się z warstwą graficzną, więc kluczowe informacje, jak stawki VAT, termin płatności, numer faktury czy dane kontrahenta nadal nie trafiają tam, gdzie powinny, a pracownik musi wyekstrahować je manualnie.

Spójrz na to samo zagadnienie od strony kosztów prowadzenia działalności. Jeśli księgowością zajmujesz się sam, „wklepując” faktury do systemu, nie pracujesz. Oczywiście możesz zatrudnić do tej samej pracy księgowego, który będzie wykonywał prostą pracę za płacę odpowiadającą swoim kwalifikacjom. Zarówno pierwsza, jak i druga opcja wydaje się mało opłacalna, prawda? A teraz pomyśl, że takich faktur musisz zaksięgować kilkaset w miesiącu. Za pomocą OCR cały ten proces można uprościć i skrócić do zaledwie kilku kliknięć.
Jak działa OCR faktury?
Technologia OCR (ang. Optical Character Recognition) służy do rozpoznawania tekstu na obrazie i konwertowania go do edytowalnej postaci. Cały proces jest dosyć złożony, ale można podzielić go na kilka mniejszych etapów.

Etap pierwszy — pozyskanie obrazu
Skaner zamienia odczytany obraz na dane binarne. Powierzchnia obrazu jest automatycznie klasyfikowana jako tło (obszary białe) lub tekst (obszary o innej barwie).
Etap drugi — Preprocessing obrazu
Na tym etapie następuje „czyszczenie” obrazu i przygotowywanie go do odczytu. W zależności od możliwości software zakres technik wykorzystywanych do oczyszczenia przestrzeni może być odmienny i obejmuje przykładowo:
- pochylenie lub obrót tekstu tak, aby zniwelować nieprawidłowe umieszczenie kartki papieru w skanerze;
- usunięcie plam, przebarwień i artefaktów, jakie powstają podczas procesu skanowania, a także rozmycie krawędzi obrazów tak, aby nie zostały uznane przez algorytm za tekst;
- rozpoznawanie boxów lub luk w tekście;
- wykorzystanie algorytmu multi języcznego do rozpoznania słów pochodzących z różnych języków.
Etap trzeci — rozpoznanie tekstu
Rozpoznanie tekstu wykorzystuje dwa rodzaje algorytmów.
- Pierwszy z nich (tzw. pattern matching) służy do porównania poszczególnych symboli z bazą danych oprogramowania. Pozwala on na rozpoznawanie faktur drukowanych z systemu lub innych dokumentów, które zostały wygenerowane maszynowo.
- Drugi typ algorytmu to tzw. feature extraction, czyli wydobycie charakterystycznych elementów dla poszczególnych znaków oraz połączeń między nimi. To może być kierunek przebiegu linii znaków czy długość elementów nadliterowych i podliterowych. W toku analizy w bazie danych wyszukiwany jest najbliższy odpowiednik danego znaku.
Etap czwarty — postprocessing
Skanowanie dokumentów OCR kończy się wygenerowaniem obrazu cyfrowego z wydzieloną warstwą tekstu.
Jakie rodzaje systemu OCR stosuje się w praktyce?
Sama nazwa Optical Character Recognition odnosi się do całej grupy technologii, których wspólnym mianownikiem jest pozyskanie tekstu z obrazu. Metod, aby taki efekt osiągnąć, jest jednak kilka.
Najprostsze rozwiązania OCR polegają na zestawieniu wykrytego znaku z bazą danych. Niestety ma to swoje wady, ponieważ w praktyce istnieje nieskończenie wiele czcionek, a także stylów pisma. Jest więc bardzo prawdopodobne, że jeżeli otrzymujesz dokumenty z kilku źródeł, a część spośród nich jest pisana ręcznie, odczytywanie niektórych faktur będzie po prostu nieskuteczne.

Znacznie bardziej zaawansowaną technologią jest ICR (ang. Intelligent Character Recognition). W tym przypadku przy tworzeniu algorytmów wykorzystuje się sztuczną inteligencję trenowaną tak, aby rozpoznawała tekst na podobieństwo działań ludzkich. Algorytmy z biegiem czasu uczą się i stają się coraz bardziej wydajne. Wariantem ICR jest IWR (ang. Intelligent Word Recognition), gdzie ocenie podlega obraz całego słowa, a nie pojedynczych liter, które go tworzą.
Dlaczego skanowanie faktur OCR się opłaca?
Program do odczytywania faktur może przynieść wiele korzyści Twojej firmie pod warunkiem, że zostanie zaprojektowany i zaimplementowany w sposób prawidłowy.
Zautomatyzuj procesy i oszczędź czas
Wygoda wyszukiwania informacji
Firmy mogą zamienić zarówno nowe, jak i już zarchiwizowane dokumenty w całkowicie interaktywną bazę danych umożliwiającą sprawne wyszukiwanie informacji. Otwiera to zupełnie nowe możliwości dla oprogramowania klasy Business Intelligence oraz software’u analitycznego, ponieważ algorytmy zyskują dostęp do znacznie większej ilości danych.
Zwiększona wydajność
OCR-owanie zeskanowanych dokumentów może znacząco wpłynąć na efektywność biznesu dzięki poprawie przepływu wewnętrznych procesów oraz usprawnieniu obiegu informacji. Ręcznie wypełnione dokumenty mogą być zeskanowane i przeanalizowane w celu sprawdzenia poprawności, weryfikacji kompletności danych oraz dalszej edycji. To ogromna oszczędność czasu!
Technologia OCR pozwala znacznie łatwiej znaleźć wybrany dokument, ponieważ system może przeszukiwać całą bazę danych w poszukiwaniu konkretnych fraz, np. faktury korygujące.
Technologia rozpoznawania znaków powoduje też, że ręczne przepisywanie notatek nie jest już potrzebne. Wystarczy je zeskanować, aby móc zmieniać treść dokumentów.
Współpraca z innymi systemami
Dzięki integracji z oprogramowaniem ERP, WMS czy softwarem księgowym odpowiednie informacje trafiają dokładnie tam, gdzie powinny, a tych samych zadań nie trzeba wykonywać wielokrotnie. To także przyspieszona praca związana z wprowadzaniem dokumentów do systemu. Zeskanowana faktura trafia od razu na dysk wirtualny (np. OneDrive czy GoogleDrive), a biuro rachunkowe może ją od razu zaksięgować.
Jakie funkcje powinien mieć program do OCR?
Skoro wiesz, jak działa program OCR, być może uznasz, że każda aplikacja sprawdzi się w praktyce tak samo dobrze. Niestety nie, ponieważ — jak mawiają — diabeł tkwi w szczegółach. Jakie funkcje powinny znaleźć się w aplikacji, abyś rzeczywiście zauważył zaoszczędzenie czasu i pieniędzy?
Podstawowe znaczenie ma zdolność programu do nauki dzięki zaimplementowanym algorytmom AI. Software powinien rozpoznawać poszczególne dane, a także analizować dokumenty kosztowe i inne w poszukiwaniu konkretnych informacji, jak data wystawienia dokumentu, kwoty netto, brutto czy nazwa kontrahenta. Brakujące dane powinny być zaznaczone tak, aby pracownik od razu widział jakie informacje powinien uzupełnić.
Ważne jest, aby aplikacja automatycznie weryfikowała różne rodzaje dokumentów. Nieważne czy celem OCR jest kontrola faktur za paliwo, czy transakcji dostawy lub sprzedaży, oprogramowanie powinno samo klasyfikować typ dokumentu.
Kolejną przydatną funkcją jest importowanie dokumentów i przechowywanie ich w elektronicznym archiwum, zabezpieczonym przed dostępem osób trzecich. Często jest to bezpieczniejsze niż trzymanie danych na dysku zewnętrznym. Coraz więcej aplikacji wykorzystuje nowoczesne metody szyfrowania, jak uwierzytelnianie dwuskładnikowe czy algorytm 256-bitowy AES gwarantujący bankowy standard zabezpieczeń.

Ręczne wprowadzanie danych z faktur jest szczególnie uciążliwe, kiedy potrzebujesz przetworzyć szybko wiele dokumentów. Dzięki OCR można przetworzyć duże ilości dokumentów w krótkim czasie pod warunkiem, że algorytm został zaprojektowany w prawidłowy sposób. Nawet najbardziej nowoczesne skanery, które na OCR-owanie dokumentu każą czekać kilka minut, powodują, że niepotrzebnie tracisz czas i może się okazać, że taka inwestycja się nie zwróci.
Darmowy OCR faktur czy komercyjny OCR do faktur? Który model wybrać?
W sieci bez trudu znajdziesz bezpłatne oprogramowanie do rozpoznawania znaków w obrazie. Wystarczy, że wpiszesz w wyszukiwarce frazę „dobry darmowy OCR”. Gotowe? No to sprawdzamy — OCRFeeder, FreeOCR, FreeOCR to Word, Nanonets czy SimpleOCR to tylko niektóre spośród rekordów, które najprawdopodobniej znalazłeś. Choć jednak OCR software może być darmowy, nie oznacza, że będzie dobry.
Przede wszystkim bezpłatne algorytmy są zwykle uproszczone. Nie znajdziesz tutaj obsługi wielu języków, współpracy z AI czy importowania danych z faktur do programu księgowego. Idąc za ciosem, łatwo dojść do wniosku, że taki program nie będzie dostosowany do potrzeb Twojej firmy.
Na marginesie warto wspomnieć, że wrzucenie pliku pdf z ważnymi informacjami na obcy serwer powoduje, że dostęp do wrażliwych danych mogą mieć osoby trzecie, a Ty nigdy nie wiesz, co się z nimi dzieje, nawet jeżeli webowa aplikacja rzeczywiście zwróciła Ci obraz z wyodrębnionym tekstem.
Czy OCR jest bezpieczny?
Kwestią, o której wielu dostawców oprogramowania OCR zapomina, jest bezpieczeństwo. Trzeba pamiętać, że faktury zawierają zwykle dane, których firma nie chce (lub nie może) ujawniać, jak imiona, nazwiska i nazwy kontrahentów, ceny produktów czy szczegóły dotyczące dostawy (pamiętaj, że ustawa o VAT pozwala na umieszczanie w treści dokumentu dodatkowych adnotacji, a nie tylko podstawowych danych).
Jeżeli te informacje nie zostaną odpowiednio zabezpieczone, ryzykujesz ich ujawnienie. W najlepszym razie taka wpadka skończy się żądaniem zapłaty kary umownej. W najgorszym — pozwem o odszkodowanie za naruszenie tajemnicy przedsiębiorstwa lub decyzją administracyjną nakładającą wysokie kary za naruszenie RODO.
Jeśli korzystasz z OCR, zadbaj, aby było bezpieczne i wykorzystaj to jako kartę atutową w negocjacjach.
Kiedy warto zdecydować się na program OCR do faktur?
Jeśli po lekturze tego wpisu doszedłeś do wniosku, że wdrożenie systemu OCR do przetwarzania faktur jest właśnie tą technologią, która sprawi, że Twój biznes nagle rozkwitnie, zaczekaj jeszcze chwilę!
W EasyAutomate kierujemy się przede wszystkim filozofią opłacalności. Oznacza to, że doradzamy naszym klientom wdrożenie wyłącznie takich rozwiązań, których zastosowanie rzeczywiście przełoży się na oszczędność czasu lub większy zarobek (a czasami obie te rzeczy). O ile to możliwe, staramy się wyrazić opłacalność inwestycji, poprzez wskaźnik ROI (ang. Return on Investment). Dzięki temu czarno na białym widzisz, czy konkretny wydatek się zwróci. Jeśli po dokładnej analizie Twojego biznesu oraz jego procesów wewnętrznych dojdziemy do wniosku, że ROI nie jest odpowiednio wysokie, z pewnością nie polecimy Ci zastosowania danej technologii.
Spójrzmy na prosty przykład. Wyobraź sobie, że prowadzisz firmę, która księguje dwa tysiące dokumentów miesięcznie. Po roku mamy ich już dwadzieścia cztery tysiące, a samo skanowanie, przesyłanie i przetwarzanie plików wymaga zatrudnienia stażysty. Albo i dwóch. OCR dokumentów pozwoli w tym przypadku nie tylko szybko i sprawnie wyszukiwać informacje, ale sprawi też, że Twoi pracownicy będą mogli zająć się bardziej kreatywnymi zadaniami, a Ty nie będziesz musiał zatrudniać pracowników do zadań, które może wykonać algorytm i zaoszczędzisz pieniądze.
A teraz spójrzmy na drugi biegun — biznes, który dopiero się rozwija i księguje pięć faktur w miesiącu, wobec czego właściciel robi to samodzielnie, „po godzinach”, a cała praca w ujęciu miesięcznym zajmuje mu godzinę.
Jak łatwo się domyśleć, w pierwszym przypadku OCR faktur ma sens, w drugim już niekoniecznie. Pamiętaj, aby nie dać wpędzić się w spiralę wiecznej optymalizacji biznesu, zamiast zwiększać zyski. Jeśli masz wątpliwości, jak możesz sprawić, aby obieg dokumentów był maksymalnie sprawny, skontaktuj się z nami. Specjaliści EasyAutomate przeanalizują Twój model biznesowy i doradzą, czy w konkretnym przypadku automatyzacja procesów biznesowych będzie trafnym posunięciem.

