Uploaded by Lora Dineva

Проект Лора Динева

advertisement
Входиране на запорни съобщения от ЧСИ
Въведение
Основна тежест на големите корпорации е документооборота и работата с хартия. Ръчното
въвеждане на информацията в системи е скъпо и води до грешки, което често означава, че
данните не могат да се използват в други процеси без човешка намеса. Дори вътрешните
процеси да бъдат прехвърлени към дигитално създадени документи, работата с външни
институции по-трудно може да се прехвърли в дигиталното пространство, тъй като изисква
координация между всички участници.
Документи могат да бъдат входирани в банката в централното деловодство или филиал на
банката, като всички писма и запитвания от институции се изпращат към централата. Ще
бъде разгледано входирането на запорни съобщения от частни съдебни изпълнители
(ЧСИ), които са 70% от входящата поща в централното деловодството и влизат в сила от дата
и часа на получаване на писмото.
Описание на текущия процес
Процесът по налагане на запори по сметки на физически и юридически лица може да
стартира с получено писмо от Националната агенция по приходите или частен съдебен
изпълнител. Тъй като двата източника се различават значително, описан е случаят за писма
от ЧСИ, тъй като са по-голямата част от запорните съобщения.
Писмата от ЧСИ пристигат на хартия по пощата, чрез куриер или приносител в
деловодството на банката. При пристигане на писмо, деловодителят проверява
съдържанието му. Ако писмото е за налагане, премахване или промяна на блокировки, то
се входира в деловодната система с вид “Запорно съобщение”. Служителят проверява за
наличие на подпис и печат на ЧСИ. Ако такъв липсва се изготвя и изпраща отговор по поща,
че документът е невалиден.
При валидно писмо, служителят попълва в системата основните реквизити. След
въвеждане, писмото се сканира и прикачва към записа в системата. Изпраща се към
системата за управление на запори. От там може да бъде върнато за корекция при
откриване на несъответствие между писмото и попълнената информация, включително
валидност на печатите и подписите, класификация на вида и други.
В случай, че писмото не е за налагане на запор то може да принадлежи към един от почти
40 други видове. Всеки вид и подвид е начало за различен процес и тези разклонения няма
да бъдат разглеждани тук.
1
Информацията от писмото се попълва в следните полета в деловодната система:
Поле
Вид
Подвид
Кореспондент
Изходящ номер на ОПИ
Номер на дело
Идентификатор на
длъжника*
Тип поле
падащо меню
падащо меню
падащо меню
свободно поле
свободно поле
свободно поле
% грешки
~0%
~1%
~1%
~3%
~3%
~0.5%
Таблица 1. Полета в деловодната система
*Системата прави проверка на идентификатора в основната система и отчита дали е клиент
или не. Ако не е клиент, записът автоматично се затваря и се изпраща имейл до
кореспондента. Служителят и системата обаче не правят валидация дали въведеното
ЕГН/ЕИК е реално. В случай, че е въведен грешен идентификатор (невалидно ЕГН напр.), се
носи висок операционен риск от неизпълнение.
Фигура 1. Текущ процес по входиране на запорно съобщение
Функционалности на IT решенията
Най-информационно интензивната стъпка е тази с въвеждане на данни от писмото в
системата. Преди нея има стъпки за класификация на документа и потвърждение на
2
валидността му с наличие на печат. Сканирането на физически документи няма да се
разглежда за автоматизация. Поради критичността на процеса, законовите изисквания и
операционен риск, за момента няма да се разглежда заменяне на действията в системата
за управление на запори, включващи проверка на въведената информация.
Фигура 2. Стъпки с потенциал за автоматизация
Необходимите функционалности са:
1) Класифициране на документа по вид и подвид съобщение
2) Откриване на обект/изображение (Computer Vision) за проверка за наличие на печат
и подпис
3) Автоматично изготвяне и принтиране на писмо
4) Оптично разпознаване на символи за конвертиране на сканирания образ в
машинно-четим текстов файл (OCR)
5) Извличане на данни от неструктуриран текст
6) Автоматично валидиране на данните – нова дейност, която да повиши качеството на
данните
a. включване на номенклатурите от падащите менюта и формулата за ЕГН към
процеса по извличане на данните
b. валидация на ЕИК чрез проверка в Търговския регистър или
информационния сайт на RegiX
7) Въвеждане в деловодната система
Преглед на решенията на пазара
Решенията, които предоставят класификация на документи и обработка на неструктуриран
текст са под общото име Интелигентна обработка на данни или Intelligent Document
Processing Platforms (IDP) и включват в себе си като първа стъпка OCR функционалността.
3
Платформата изисква ръчно класифициране на документи и маркиране на информацията
за извличане. За структурирани и полу-структурирани документи, необходимите данни за
трениране са около 5 документа от вид. В случая на писма на български, които не следват
шаблон, е необходимо подаване на около 100 ръчно маркирани документа. Такива
решения са Abbyy, Kofax, Rossum, Indeco и други. Тези софтуери могат да бъдат закупени
като цялостна платформа или като част от пакетите на платформите за роботизиране на
процеси (RPA).
За откриване на обект – в случая подпис и печат – на сканираното изображение е
необходима Computer Vision функционалност. Налична е в облачните платформи на
Microsoft и Google и се таксува на брой документи. Разликата в цените е малка и няма да е
водеща при избирането на услугата. След тестване на двете възможности, може да се
избере доставчик на услугата по успеха на решенията при разпознаване на съответните
елементи.
Решение
AZURE
GOOGLE CLOUD
Цена на 1000 страници
Брой страници на месец
6,400
€
1.32
6,400
€
1.35
Таблица 2. Доставчици на Computer Vision
Крайна цена
8.45
8.64
Автоматизирането на процесите по въвеждане на информация, валидация във външни
източници и изготвяне на писма по шаблон може да се реализира чрез доработки в
системите. В случаите на стари (legacy) системи това е често скъпо и не винаги е възможно.
Друга възможност за автоматизация е чрез robotic process automation (RPA) софтуер, който
позволява разработка с ниско ниво на програмиране (low-code).
RPA решенията използват изкуствен интелект за откриване на елементи от системата на
екран и попълване на информация в полетата без да е необходима софтуерна доработка,
за да отговори на бизнес процеса и нуждите.
В рамките на 8 часовия работен ден, един лиценз е ограничен и достатъчен за
изпълнението на един непрекъснат процес като описаният по-горе1. Избираме RPA
решението, защото е единна платформа, която ще предостави и IDP функционалност, както
и управление на целия процес – от входа на документите, заявки към облачни услуги, до
въвеждане в системата.
Има множество налични RPA решения на пазара, като само част от тях за момента имат
включена функционалност за класификация и разчитане на неструктурирани текстове.
Всички те също така предлагат откриване на елементи и изображения. По-долу изброените
или вътрешно са разработили такъв пакет или са включили софтуер от лицензиран
1
Останалите 16 часа от денонощието, лицензът може да се използва за други дейности.
4
партньор. При избора, като първи приоритет е наличието на ресурс специалисти и
компании, които се занимават с внедряването и поддръжката на платформата, за да се
избегнат разходи по наемане и обучаване на специалисти. UiPath е подходящ вариант в
случая.
Разработчици/поддръжка
на
българския пазар
UiPath
€
8,500.00
има
IBM
€ 10,080.00
има
Appian
€
6,756.00
няма, или ресурсът е силно ограничен
Automation Anywhere
€ 12,000.00
има
Blue Prism
€
8,400.00
няма, или ресурсът е силно ограничен
Таблица 3. Софтуери за роботизирана автоматизация на процеси
Софтуер
Лиценз на година
Инвестиционна оценка
Оценка на разходите в текущия процес
Текущият разход е оперативен разход основно за човешки труд. От средни стойности за
брой писма на ден и време за обработка на едно писмо може да се оцени натоварване за
около двама и половина служители на пълен работен ден (FTE). Със заложени стойности за
отпуски, болнични и почивки, както и заплата със осигуровки, годишния разход е над 25
500 евро разход на годишна база.
Брой на
ден
Дейност
Преглед
Общо
натоварване
на ден
FTE
Годишен разход
457
0:00:10
1:16:11
0.19
€
1,788.00
320
0:00:10
0:53:20
0.13
€
1,248.00
3.2
0:10:00
0:32:00
0.08
€
756.00
320
0:02:30
13:20:00
1.96
€
18,768.00
320
9.6
0:00:15
0:05:00
1:20:00
0:48:00
0.20
0.12
€
€
1,872.00
1,128.00
2.66
€
Таблица 4. Годишен разход за труд по дейности от процеса
25,560.00
Проверка за печат
Изготвяне на отговор
за невалидно писмо
Прочитане и
въвеждане на писма
Сканиране
Корекция на данни
Общо
Време на
брой
5
Оценка на разходите след внедряване на решението
Инвестицията ще бъде разходът за разработка и внедряване на решението, оценена
експертно на база цените за човекочасове и комплекност на задачата. Оперативните
разходи са лиценз за RPA и човешки труд за неавтоматизираните дейности, включително
разхода за служители за корекция на възникнали грешки. Грешките са заложени да паднат
до 2% в първата година. От бизнес гледна точка, някои от действията се разглеждат заедно,
защото са или невъзможни или нелогични да се разделят. Това са:
•
•
Проверката за печат и действия в случай, че липсва
Извличане и въвеждане на информация
Оперативен разход
1. Класификация
(на година)
2. Проверка печат +
изготвяне на писмо
Лиценз
Човешка намеса
Цена за услуга
€
€
€
€
€
€
8,500.00
23,772.00
-
3. Извличане и въвеждане
на информация
8,500.00 €
23,556.00 €
101.40 €
8,500.00
6,792.00
-
€
32,272.00
€
32,157.40 €
Таблица 5. Годишни оперативни разходи след внедряване
15,292.00
Лицензът е споделен ресурс, въпреки това при избор на въвеждане на първо решение, то
самостоятелно ще понесе разхода, затова първоначалното изчисление на възвращаемост
ще го разглеждаме като дедикиран към съответното решение ресурс.
Дейност
3. Извличане и
въвеждане на
информация
2. Проверка печат +
изготвяне на писмо
1. Класификация
Инвестиция
Текущ годишен
разход
Годишен разход
след
инвестицията
ROI - Y3
€
15,000.00
€
25,560.00
€
15,292.00
105%
€
2,000.00
€
25,560.00
€
32,157.40
Отрицателен
€
25,560.00
€
32,272.00
Отрицателен
€
6,000.00
Таблица 6. Възвращаемост на инвестицията на третата година
Възвращаемостта от извличането на информация е 105% на третата година, като спестеният
годишен разход покрива изцяло инвестицията през втората година. Класифицирането на
документите не спестява достатъчно ръчен труд, за да се изплати през първите 3 години.
Същото важи и за проверката за печат. Принципът на работа на лицензът, позволява да се
покрият всички дейности без допълнителен разход и без алтернативни разходи
(opportunity cost). Внедряването на дейност (2) ще спести малко под 2000 евро за първата
6
година и ще има положителна възвращаемост след това. Дейност (1) не покрив достатъчен
обем от работа по този процес, за да има възвращаемост през първите 3 години и няма да
се планира за внедряване за обслужване само на този процес.
Процес по внедряване
Фигура 3. Фази на имплементация
Приоритет при внедряването на решенията ще бъде успеваемостта на моделите и
поставена цел от 2% грешка, за да има допълнителна ефективност от подобрение на
качеството на работата.
Фаза 1 от имплементацията ще въведе функционалността за извличане на данни от писмо
и въвеждане в системата. За внедряването трябва да се подготви набор от сканирани писма
и описание на съответните им реквизити за трениране на модела. Трябва да се оцени
успеха на OCR системата за разпознаване на символите при различни качества на
сканираното изображение. При нужда, за да се подсигури хардуерна обезпеченост на
процеса, да се закупи скенер с по-високо качество. Трябва да се оцени и извлечената
информация, като очакваната грешка е до 2% (случаите, в които е необходима човешка
намеса за ръчно нанасяне на данните). За подобрение на резултатите могат да се включат
и валидации на очакваните стойности спрямо налични номенклатури, формула за ЕГН и
проверки в Търговски регистър. Фазата включва и разработването на работа в деловодната
система, която изисква единствено вярно идентифициране на полетата за въвеждане на
информация. Изведената от системата информация може да бъде съпоставена с реално
въведената със или без намеса от човек за подобрение на алгоритъма.
7
Фаза 2 ще обхване проверката за подпис и печат, отново чрез трениране върху ръчно
маркирани документи. Липсата на подпис или печат е малко вероятна, а погрешно
решение, че липсват обектите стартира процес по неизпълнение, който носи висок риск.
Затова, проверката ще се внедри, ако общата му грешка е под 2%, а тази от тип 2 е под 1%.
Заключение
Оценката на възвращаемост на инвестицията показва, че обработката на документи чрез
изкуствен интелект има добра възвращаемост, когато обемите са големи и събраните
данни се използват в автоматизирани бизнес процеси. Също така, някои от дейностите не
са достатъчно интензивни, ако се разглежда само определен процес. Класификацията на
документи би била много по-ефективна, ако се приложи върху целия документооборот. В
такива случаи трябва се търси глобално и дългосрочно решение. Отделни под-процеси
могат да се оптимизират локално с low-code решения, за да се постига спестяване на
разходи, да се подсигури качество на данните и по-лесно да се адаптират към промени в
натоварването. Внедряването на решенията трябва да включва оценка на успеха на
моделите чрез тестове, демота и договорености с доставчици.
Бъдещи инициативи и стъпки, които могат да се предприемат са:
1) Оптимизация на процеса
Процесът по налагане/промяна/премахване на запорни съобщения продължава след
обработката на писмото, съответно след внедряване на избраните решения и оценка на
грешките, може да се премине към премахване на част от следващите проверки на
информацията и системни действия.
2) Разширяване на обхвата на решенията
Класификационните модели за документи, които разгледахме, не са подходящи за
малки обеми от неструктурирани текстове. Внедряването им трябва да обхване цялата
организация, като може изцяло да замени стари електронни архиви и деловодни
системи. Възможността бързо и с малък процент грешки да се извлича стойностната
информация води и до намален операционен риск при институционални запитвания,
както и повишена клиентска удовлетвореност при комуникация с потребители.
3) Оптимизиране на разходите и инвестициите
Внедряването на решенията включва закупуването на ресурси, които могат да бъдат
споделени между различни процеси. Лицензи за RPA, разработени канали за заявки
към услуги като Azure и Google Cloud, и събран опит в организацията за внедряване на
подобни решения са придобивки, които трябва да се използват.
8
Цялостната дигитализация трябва да е съчетание от автоматизации „на парче“, с висока
възвращаемост, и стратегически инициативи, които да доставят по-устойчиви решения.
9
Download