Методика оценки качества программных продуктов, имеющих в своем составе искусственный интеллект, в задачах классификации и распознавания документов
А. Н. Милованов1, А. А. Мистюков2, Д. А. Трусов3, А. А. Коршунов4
1,2,3,4ООО «Логстрим», Москва, Россия
1amilovanov@logstream.ru, 2amistyukov@logstream.ru, 3dtrusov@logstream.ru, 4akorshunov@logstream.ru
Аннотация. Представлены результаты исследований, проведенных российской IT- компанией «Логстрим», по оценке качества программных продуктов, имеющих в своем составе искусственный интеллект, в задачах классификации и распознавания документов. В ходе проведения исследований разработана методика, которая позволяет оценить качество программных продуктов, имеющих в своем составе искусственный интеллект, в задачах классификации и распознавания документов. По разработанной методике была проведена оценка качества программного комплекса «ЭКО-ДОК», в состав которого входит сервис с нейронной сетью YOLO v5, в задачах классификации и распознавания документов. Представлены результаты тестирования и оценки качества программного комплекса «ЭКО-ДОК».
Ключевые слова: методика, оценка качества программного комплекса, нейронная сеть, система искусственного интеллекта, программный комплекс «ЭКО-ДОК», характеристики качества, показатели качества, элементы показателя качества, метрики функциональной корректности
Финансирование: статья публикуется при софинансировании ФГБУ «Фонд содействия развития малых форм предприятий в научно-технической сфере».
Для цитирования: Милованов А. Н., Мистюков А. А., Трусов Д. А., Коршунов А. А. Методика оценки качества программных продуктов, имеющих в своем составе искусственный интеллект, в задачах классификации и распознавания документов // Известия высших учебных заведений. Поволжский регион. Технические науки. 2024.№ 2. С. 58–72. doi: 10.21685/2072-3059-2024-2-4
A methodology for assessing the quality of software products that include artificial intelligence in the tasks of document classification and recognition
A.N. Milovanov1, A.A. Mistyukov2, D.A. Trusov3, A.A. Korshunov4
1,2,3,4 “Logstream” LLC, Moscow, Russia
1amilovanov@logstream.ru, 2amistyukov@logstream.ru, 3dtrusov@logstream.ru, 4akorshunov@logstream.ru
Abstract. The article presents the results of research conducted by the Russian IT company “Logstream” to assess the quality of software products that include artificial intelligence in document classification and recognition tasks. During the research, a methodology was developed that allows us to evaluate the quality of software products that include artificial
intelligence in document classification and recognition tasks. The developed methodology was used to evaluate the quality of the “ECO-DOC” software package, which includes the YOLO v5 neural network service, in document classification and recognition tasks. The results of testing and quality assessment of the ECO-DOC software package are presented.
Keywords: methodology, software package quality assessment, neural network, artificial intelligence system, “ECO-DOC” software package, quality characteristics, quality indica- tors, quality indicator elements, functional correctness metrics
Financing: the article is financed by the Federal State Budgetary Institution “Fund for As- sistance to Small Innovative Enterprises in the Scientific and Technical Sphere”.
For citation: Milovanov A.N., Mistyukov A.A., Trusov D.A., Korshunov A.A. A metho- dology for assessing the quality of software products that include artificial intelligence in the tasks of document classification and recognition. Izvestiya vysshikh uchebnykh zavedeniy. Povolzhskiy region. Tekhnicheskie nauki = University proceedings. Volga region. Engineering sciences. 2024;(2):58–72. (In Russ.). doi: 10.21685/2072-3059-2024-2-4
Введение
В настоящее время в мире происходит массовое внедрение искусственного интеллекта в различные области и сферы нашей жизни – в Интернет, медицину, бизнес, транспорт и другие сферы.
Российская IT-компания «Логстрим» также уделяет большое внимание этому направлению и занимается внедрением искусственного интеллекта для решения задач по классификации и распознаванию текста и изображений со скан-образов печатных документов.
В рамках импортозамещения программного обеспечения компанией «Логстрим» был разработан отечественный программный комплекс «ЭКО-ДОК», который помогает структурировать разнопрофильные непрерывные потоки документов в единую организованную систему.
При софинансировании ФГБУ «Фонд содействия развития малых форм предприятий в научно-технической сфере» компанией «Логстрим» были проведены научные исследования в области классификации и распознавания текста и изображений со скан-образов печатных документов и разработан программный компонент «Модуль классификации скан-образов по типу документов», который вошел в состав программного комплекса «ЭКО-ДОК». Программный компонент «Модуль классификации скан-образов по типу документов» предназначен для классификации и распознавания текста и изображений со скан-образов печатных документов. В состав данного программного компонента входит сервис с нейронной сетью YOLO v5.
Важными этапами разработки программного обеспечения являются проведение тестирования и оценка качества программного продукта. После разработки программного компонента «Модуль классификации скан-образов по типу документов» возник актуальный вопрос по оценке качества функционирования нейронной сети YOLO v5 и программного комплекса «ЭКО- ДОК» в целом в задачах классификации и распознавания документов.
Анализ ведущих российских научных электронных библиотек «Кибер- Ленинка», eLIBRARY.RU и других открытых российских интернет-ресурсов показал отсутствие публикаций с описанием методик по оценке качества программных продуктов, имеющих в своем составе искусственный интеллект, и результатами тестирования таких программных продуктов. Данный факт показывает, что в России на данный момент практически не ведутся исследования по решению задачи оценки качества программных продуктов, имеющих в своем составе искусственный интеллект.
В ходе исследований по данному направлению не проводился анализ зарубежных источников с публикациями по оценке качества программных продуктов, имеющих в своем составе искусственный интеллект. В зарубежном источнике [1] представлен подробный обзор литературы и публикаций по исследованиям с 1988 по 2020 г. в области оценки качества программного обеспечения на основе искусственного интеллекта.
Одной из основных задач при проведении научных исследований компанией «Логстрим» была разработка методики оценки качества программных продуктов, имеющих в своем составе искусственный интеллект в задачах классификации и распознавания документов с учетом выполнения требований российских регламентирующих стандартов.
На основании разработанной методики была проведена оценка качества программного комплекса «ЭКО-ДОК», имеющего в своем составе сервис и нейронную сеть YOLO v5, в задачах классификации и распознавания документов.
Научная новизна исследования состоит в решении задачи оценки качества программных продуктов, имеющих в своем составе искусственный интеллект, в задачах классификации и распознавания документов; разработке методики оценки качества программных продуктов, имеющих в своем составе искусственный интеллект, в задачах классификации и распознавания документов; получение количественных оценок качества программного комплекса «ЭКО-ДОК», имеющего в своем составе сервис с нейронную сеть YOLO v5, в задачах классификации и распознавания документов.
Описание методики
На данный момент в России действует большая группа стандартов, регламентирующих оценку качества программных продуктов: ИСО/МЭК 2501n – раздел моделей качества; ИСО/МЭК 2502n – раздел измерения качества; ИСО/МЭК 2503n – раздел требований к качеству; ИСО/МЭК 2504n – раздел оценки качества.
Анализ данных стандартов показал отсутствие в них:
– рекомендаций по выбору внешних показателей качества и элементов показателя качества программного продукта для оценки качества программного продукта в задачах классификации и распознавания документов;
– требований и рекомендаций по оценке качества программных продуктов, имеющих в своем составе искусственный интеллект, в задачах классификации и распознавания документов.
Согласно стандарту ГОСТ Р 57700.36–20211 нейронная сеть относится к искусственному интеллекту. Поэтому программные продукты, имеющее в своем составе искусственный интеллект, можно отнести к системам искусственного интеллекта.
1 ГОСТ Р 57700.36–2021. Высокопроизводительные вычислительные системы. Оценка производительности высокопроизводительных вычислительных систем на алгоритмах, использующих сверточные нейронные сети.
Оценка качества систем искусственного интеллекта регламентируется стандартом ГОСТ Р 59898–20211.
Сравнение стандартов 2502n, 2504n и ГОСТ Р 59898–2021 показывает наличие различий в терминологии, определениях и подходах по оценке качества программного продукта и оценке качества системы искусственного интеллекта. В стандарте ГОСТ Р 59898–2021 отсутствуют подробные требования и рекомендации по порядку проведения тестирования систем искусственного интеллекта и содержанию документации тестирования. Требования и рекомендации по контролю и выполнению тестирования программного обеспечения представлены в серии стандартов ГОСТ Р 56920–20162, ГОСТ Р 56921–20163, ГОСТ Р 56922–20164. ГОСТ 19.301–19795 устанавливает требования к содержанию и оформлению программного документа «Про- грамма и методика испытаний».
Использование требований рассмотренных групп стандартов по от- дельности не позволяет произвести оценку качества программных продуктов, имеющих в своем составе искусственный интеллект, и провести тестирование.
В связи с этим компанией «Логстрим» была разработана методика оценки качества программных продуктов, имеющих в своем составе искусственный интеллект, в задачах классификации и распознавания документов (далее методика).
Данная методика разработана на основании требований стандарта ГОСТ Р 59898–2021, также в методике учтены требования серии стандартов 2501n, 2502n, 2504n, серии ГОСТ Р 56920–2016, ГОСТ Р 56921–2016, ГОСТ Р 56922–2016 и требования стандарта ГОСТ 19.301–1979.
В разработанной методике предлагается сначала проводить оценку качества программного продукта, а затем проводить оценку качества программного продукта как системы искусственного интеллекта (СИИ) в задачах классификации и распознавания документов.
Методика состоит из следующих этапов:
Этап 1 – подготовительные работы. Этап 2 – тестирование.
Этап 3 – оценка качества программного продукта в задачах классифи- кации и распознавания документов.
Этап 4 – оценка качества программного продукта как СИИ в задачах классификации и распознавания документов.
Этап 5 – анализ результатов оценки.
На этапе 1 проводятся следующие мероприятия:
1 ГОСТ Р 59898–2021. Оценка качества систем искусственного интеллекта. Общие положения.
2 ГОСТ Р 56920–2016. Системная и программная инженерия. Тестирование программного обеспечения. Часть 1. Понятия и определения.
3 ГОСТ Р 56921–2016. Системная и программная инженерия. Тестирование программного обеспечения. Часть 2. Процессы тестирования.
4 ГОСТ Р 56922–2016. Системная и программная инженерия. Тестирование программного обеспечения. Часть 3. Документация тестирования.
5 ГОСТ 19.301–1979. Государственный стандарт СССР. ЕСПД. Программа и методика испытаний. Требования к содержанию и оформлению.
– разрабатывается программа и методики испытаний программного продукта;
– определяется набор данных для тестирования и подготавливаются данные для тестирования;
– создается испытательный стенд для проведения тестирования.
В программе и методиках испытаний программного продукта содержатся следующие разделы:
– объект испытаний и цель испытаний;
– требования к программе;
– требования к программной документации;
– выбор и обоснование характеристик качества программного продукта и критериев их оценки в задачах классификации и распознавания документов;
– выбор и обоснование характеристик качества программного продукта как СИИ и критериев их оценки в задачах классификации и распознавания документов;
– требования к тестовым данным (далее data test);
– состав и порядок проведения испытаний;
– методы испытаний;
– отчетность;
– методики испытаний.
Затем определяется набор данных и подготавливаются данные для тестирования, создается испытательный стенд для проведения тесирования.
На этапе 2 в соответствии с программой и методиками испытаний проводится тестирование программного продукта.
На этапе 3 после тестирования оцениваются характеристики качества программного продукта в задачах классификации и распознавания документов.
На этапе 4 после тестирования оцениваются характеристики качества программного продукта как СИИ в задачах классификации и распознавания документов.
На этапе 5 проводится анализ результатов оценки качества программного продукта, имеющего в свое составе искусственный интеллект, в задачах классификации и распознавания документов и оформляются протоколы тестирования.
Результаты исследования и их обсуждение
Как уже было указано, в программном компоненте «Модуль классификации скан-образов по типу документов» программного комплекса «ЭКО-ДОК» имеется сервис с нейронной сетью YOLO v5. Согласно стандарту ГОСТ Р 57700.36–2021 нейронная сеть является искусственным интеллектом, поэтому программный комплекс «ЭКО-ДОК» можно отнести к СИИ.
Раскроем подробно каждый этап оценки качества программного комплекса «ЭКО-ДОК» (далее ПК «ЭКО-ДОК»).
Этап 1
Определены: объект испытаний и цель испытаний; требования к программе; требования к программной документации; требования к data test; состав и порядок проведения испытаний; методы испытаний; отчетность.
Создан стенд для проведения испытаний.
На данный момент в ПК «ЭКО-ДОК» имеется четыре класса классификации одностраничных первичных документов бухгалтерского учета:
1) тип документа – «УПД».
2) тип документа – «СФ».
3) тип документа – «АКТ».
4) не определен тип документа – «Undefined».
Поэтому для тестирования был подготовлен следующий data test:
– файл формата jpeg с одностраничным документом «УПД» – 524 шт.;
– файл формата jpeg с одностраничным документом «CФ» – 524 шт.;
– файл формата jpeg с одностраничным документом «АКТ» – 524 шт.;
– файл формата jpeg с одностраничным документом бухгалтерского учета (не УПД, не СФ и не АКТ) – 524 шт.
Для оценки качества ПК «ЭКО-ДОК» на основании стандарта ГОСТ Р ИСО/МЭК 25010–20151 была выбрана модель качества продукта.
Цель оценки качества ПК «ЭКО-ДОК» – это оценка функциональных требований способности классифицировать и распознавать документы. Поэтому для оценки качества в соответствии со стандартом ГОСТ Р ИСО/МЭК 25010–2015 были выбраны характеристика качества программного продукта, функциональная пригодность и ее подхарактеристика – функциональная корректность.
В стандартах ИСО/МЭК 2502n отсутствуют рекомендации по выбору внешних показателей качества и элементов показателя качества программного продукта для характеристики качества функциональной пригодности в задачах классификации и распознавания документов. Поэтому требуется определить показатели качества и элементы показателя качества для программного продукта в задачах классификации и распознавания документов, чтобы оценить качество ПК «ЭКО-ДОК» в задачах классификации и распознавания документов.
В ходе работы ПК «ЭКО-ДОК» может распознавать или не распознавать тип документа, что является случайным событием. Согласно теории вероятности [2] случайным событием называется любой факт, который в результате испытания может произойти или не произойти. Для практической деятельности необходимо сравнивать события по степени возможности их наступления. Для сравнения событий используется численная мера степени объективности возможности наступления события, которая называется вероятностью события. На практике оценку неизвестной вероятности P события А
оценивают по его частоте (статистической вероятности события независимых опытах.
P ( A) ) в n
1 ГОСТ Р ИСО/МЭК 25010–2015. Системная и программная инженерия. Требования и оценка качества систем и программного обеспечения (SQuaRE). Модели качества систем и программных продуктов.
Согласно теории вероятности [2] статистическая вероятность события А называется относительной частотой (частностью) появления этого события в n произведенных испытаниях и определяется по формуле
P ( A) = m/n
где P ( A) – статистическая вероятность события А; m n – относительная частота, частность события А; m – число испытаний, в которых появилось событие А; n – общее число испытаний.
Для оценки качества ПК «ЭКО-ДОК» в задачах классификации и распознавания были определены показатель качества, статистическая вероятность распознавания документов и элементы показателя качества – статистические вероятности распознавания для каждого типа документа:
1) P(АУПД ОС) – статистическая вероятность события АУПД ОС распознавания ПК «ЭКО-ДОК» одностраничного документа типа «УПД»;
2) P(АСФ ОС) – статистическая вероятность события АСФ ОС распознавания ПК «ЭКО-ДОК» одностраничного документа типа «СФ»;
3) P(ААКТ ОС) – статистическая вероятность события ААКТ ОС распознавания ПК «ЭКО-ДОК» одностраничного документа типа «АКТ».
Критерии оценки успешного функционирования ПК «ЭКО-ДОК» по классификации и распознаванию одностраничных документов представлены в табл. 1.
Таблица 1
Критерии оценки качества ПК «ЭКО-ДОК»
Характеристика | Обозначение вероятности | Критерий оценки |
---|---|---|
Статистическая вероятность распознавания ПК «ЭКО-ДОК» одностраничного документа типа «УПД» | P (АУПД ОС) | не менее 0,9 |
Статистическая вероятность распознавания ПК «ЭКО-ДОК» одностраничного документа типа «СФ» | P (АСФ ОС) | не менее 0,9 | Статистическая вероятность распознавания ПК «ЭКО-ДОК» одностраничного документа типа «АКТ» | P (ААКТ ОС) | не менее 0,9 |
ПК «ЭКО-ДОК» считается успешно выдержавшим испытания, когда фактические результаты тестирования соответствуют критериям оценки, указанным в табл. 1.
Для оценки точности и надежности полученных значений P ( A) согласно теории вероятности и математической статистики [2, 3] будет использован параметр – доверительный интервал Ib для различных доверительных вероятностей b.
Согласно источникам [2, 3] доверительные границы P1 и P2 доверительного интервала Ib рассчитываются по формулам:
где P1 – левая доверительная граница доверительного интервала Ib; P2 – правая доверительная граница доверительного интервала Ib; P ( A) – статистическая вероятность события А; n – количество проведенных опытов; t – параметр, определяемый в зависимости от доверительный вероятности b.
Согласно результатам исследований, опубликованным в источнике [4], размер выборки является одной из важнейших характеристик, от которой за- висит оптимальная доверительная вероятность и доверительный интервал. В случае, если выборка является большой (n > 200), можно говорить об отсутствии неопределенности, а также о слабой зависимости от вида закона распределения, что соответствует детерминированному типу неопределенности. Поэтому количество документов каждого типа в data test должно быть не менее 200.
На втором этапе оценки качества ПК «ЭКО-ДОК» как СИИ в задачах классификации и распознавания документов требуется выбрать характеристики качества программного продукта как СИИ и метрики их оценки.
На основании ГОСТ Р 59898–2021 для оценки качества ПК «ЭКО-ДОК» как СИИ были выбраны существенная характеристика – функциональные возможности, и ее субхарактеристика – функциональная корректность.
Выбраны следующие метрики оценки функциональной корректности в задачах классификации и распознавания:
1. Метрика A – доля правильных исходов (accuracy) рассчитывается по формуле
A = TP + TN , A[0,1]
TP + TN + FP + FN
где TP – количество истинно положительных исходов; TN – количество истинно отрицательных исходов; FP – количество ложно положительных исходов; FN – количество ложно отрицательных исходов.
2. Метрика Pr – точность (precision, revelance), рассчитывается по формуле
Pr = TP, Pr [0,1]
TP + FP
3. Метрика Se – чувствительность, полнота (sensitivity, recall), рассчи- тывается по формуле
Se = TP, Se [0,1]
TP + FP
4. Метрика Sp – избирательность (specificity), рассчитывается по формуле
Sp = TP, Sp [0,1]
TP + FP
5. Метрика F – мера, рассчитывается по формуле
F = 2 × Pr × Re, F [0,1]
Pr + Re
Pr = TP * Pe = TP
TP + FP TP + FN
Метрики функциональной корректности и критерии оценки качества ПК «ЭКО-ДОК» как СИИ для задач классификации и распознавания документов представлены в табл. 2.
Таблица 2
Критерии оценки качества ПК «ЭКО-ДОК» как СИИ
Метрика функциональной корректности | Обозначение метрики | Критерий оценки | |
---|---|---|---|
1 | Класс классификации документа – «УПД» | ||
1.1 | Доля правильных исходов | АУПД | не менее 0,9 |
1.2 | Точность | PrУПД | не менее 0,9 |
1.3 | Полнота, чувствительность | SeУПД | не менее 0,9 |
1.4 | Избирательность | SpУПД | не менее 0,9 |
1.5 | F-мера | FУПД | не менее 0,9 |
2 | Класс классификации документа – «СФ» | ||
2.1 | Доля правильных исходов | АСФ | не менее 0,9 |
2.2 | Точность | PrСФ | не менее 0,9 |
2.3 | Полнота, чувствительность | SeСФ | не менее 0,9 |
2.4 | Избирательность | SpСФ | не менее 0,9 |
2.5 | F-мера | FСФ | не менее 0,9 |
3 | Класс классификации документа – «АКТ» | ||
3.1 | Доля правильных исходов | ААКТ | не менее 0,9 |
3.2 | Точность | PrАКТ | не менее 0,9 |
3.3 | Полнота, чувствительность | SeАКТ | не менее 0,9 |
3.4 | Избирательность | SpАКТ | не менее 0,9 |
3.5 | F-мера | FАКТ | не менее 0,9 |
4 | Класс классификации документа – «Undefined» | ||
4.1 | Доля правильных исходов | АU | не менее 0,9 |
4.2 | Точность | PrU | не менее 0,9 |
4.3 | Полнота, чувствительность | SeU | не менее 0,9 |
4.4 | Избирательность | SpU | не менее 0,9 |
4.5 | F-мера | FУ | не менее 0,9 |
ПК «ЭКО-ДОК» как СИИ считается успешно выдержавшим испытания, когда фактические результаты тестирования соответствуют критериям оценки качества, указанным в табл. 2.
Этап 2
Тестирование ПК «ЭКО-ДОК» проводилось на основании разработанной программы и методик испытаний методом «черного ящика» по двум сценариям тестирования.
Сценарий тестирования 1 заключался в следующем: в ПК «ЭКО-ДОК» отправляется пачка файлов одностраничных документов для классифицирования и распознавания документа. В пачке находится 524 документа одного типа. Сначала в ПК «ЭКО-ДОК» отправляется пачка файлов документов «УПД», затем отправляется пачка файлов документов «СФ», затем в ПК «ЭКО-ДОК» отправляется пачка файлов документов «АКТ».
Ожидаемый результат: ПК «ЭКО-ДОК» классифицирует и распознает каждый документ и присваивает каждому документу класс «УПД» или «СЧФ», или «АКТ» и выводит результат. Если ПК «ЭКО-ДОК» определил документ как другой тип, то фактический результат засчитывался как «Undefined» – тип документа не определен.
Фактические результаты тестирования по каждому документу должны быть зафиксированы и обработаны.
Сценарий тестирования 2 заключался в следующем: в ПК «ЭКО-ДОК» отправляется пачка файлов одностраничных документов для классифицирования и распознавания документа. В пачке находится 2096 документов всех типов («УПД», «СФ», «АКТ» и различные документы не «УПД», не «СФ» и не «АКТ»). Количество документов каждого класса 524 шт.
Ожидаемый результат: ПК «ЭКО-ДОК» классифицирует и распознает каждый документ и присваивает документу класс «Тип документа» и выводит результат.
Фактические результаты тестирования по каждому документу должны быть зафиксированы и обработаны.
Этап 3
После проведения тестирования по сценарию тестирования 1 фактические результаты тестирования были зафиксированы и обработаны. Затем бы- ла проведена оценка качества ПК «ЭКО-ДОК» в задачах классификации распознавания документов.
Статистическая вероятность ПК «ЭКО-ДОК» одностраничного документа типа «УПД», «СФ» и «АКТ» рассчитывалась по формуле (1) на основании фактических результатов тестирования, результаты расчета представлены в табл. 3. В табл. 4 представлены результаты тестирования (результаты оценки характеристик) ПК «ЭКО-ДОК».
Затем была проведена оценка точности и надежности полученных значений P ( A) . Для различных доверительных вероятностей b был рассчитан доверительный интервал Ib по формулам (2) и (3), результаты расчета представлены в табл. 5.
Таблица 3
Фактические результаты тестирования (сценарий тестирования 1)
Характеристика | Обозначение | «УПД» | «СФ» | «АКТ» |
---|---|---|---|---|
Общее число испытаний | n | 524 | 524 | 524 |
Число испытаний, в которых появилось событие А | m | 507 | 508 | 488 | Статистическая вероятность события А | P (A) | 0,97 | 0,97 | 0,93 |
Примечание. При тестировании одного типа документа, если ПК «ЭКО-ДОК» определил его как другой тип, то фактический результат засчитывался как «Undefined» – тип документа не определен.
Таблица 4
Результаты тестирования ПК «ЭКО-ДОК»
- Обозначение
- Критерий оценки
- Фактический результат
- Результат тестирования
Характеристика | Обозначение | Критерий оценки | Фактический результат | Результат тестирования |
Характеристика | $3999 /year | |||
Статистическая вероятность распознавания ПК «ЭКО-ДОК» одностраничного документа типа «УПД» | P (АУПД ОС) | не менее 0,9 | 0,97 | Успешно |
Статистическая вероятность распознавания ПК «ЭКО-ДОК» одностраничного документа типа «СФ» | P (АСФ ОС) | не менее 0,9 | 0,97 | Успешно |
Статистическая вероятность распознавания ПК «ЭКО-ДОК» одностраничного документа типа «АКТ» | P (ААКТ ОС) | не менее 0,9 | 0,97 | Успешно | Buy Now |
Характеристика | Обозначение | Критерий оценки | Фактический результат | Результат тестирования |
---|---|---|---|---|
Статистическая вероятность распознавания ПК «ЭКО-ДОК» одностраничного документа типа «УПД» | P (АУПД ОС) | не менее 0,9 | 0,97 | Успешно |
Статистическая вероятность распознавания ПК «ЭКО-ДОК» одностраничного документа типа «СФ» | P (АСФ ОС) | не менее 0,9 | 0,97 | Успешно | Статистическая вероятность распознавания ПК «ЭКО-ДОК» одностраничного документа типа «АКТ» | P (ААКТ ОС) | не менее 0,9 | 0,93 | Успешно |
Таблица 5
Результаты расчета доверительных интервалов Ib
Наименование характеристики | Доверительная вероятность | ||
---|---|---|---|
b = 0,9, t = 1,643 |
b = 0,95, t = 1,96 |
b =0,99, t = 2,576 |
|
P (АУПД ОС) = 0,97 | |||
Левая доверительная граница P1 доверительного интервала IB | 0,955 | 0,951 | 0,944 |
Правая доверительная граница P2 доверительного интервала IB | 0,980 | 0,981 | 0,984 |
P (АСФ ОС) = 0,97 | |||
Левая доверительная граница P1 доверительного интервала IB | 0,955 | 0,951 | 0,944 |
Правая доверительная граница P2 доверительного интервала IB | 0,980 | 0,981 | 0,984 |
P (ААКТ ОС) = 0,93 | |||
Левая доверительная граница P1 доверительного интервала IB | 0,909 | 0,904 | 0,895 |
Правая доверительная граница P2 доверительного интервала IB | 0,946 | 0,948 | 0,953 |
Этап 4
После проведения тестирования по сценарию тестирования 2 фактиче- ские результаты тестирования были зафиксированы и обработаны. Затем была проведена оценка качества ПК «ЭКО-ДОК» как СИИ в задачах классификации и распознавания документов.
В табл. 6 представлены фактические результаты тестирования по каждому типу документа.
Таблица 6
Фактические результаты тестирования (сценарий тестирования 2)
Тип документа | Распознаны как класс | Всего документов, шт. | |||
---|---|---|---|---|---|
«УПД», шт. | «СФ», шт. | «АКТ», шт. | «Undefined», шт. | ||
«УПД» | 507 | 6 | 1 | 10 | 524 |
«СФ» | 0 | 508 | 12 | 4 | 524 |
«АКТ» | 0 | 0 | 488 | 36 | 524 |
Различные документы | 0 | 0 | 11 | 513 | 524 |
На основании фактических результатов тестирования (табл. 6) исходы для каждого класса рассчитываются следующим образом.
Класс «УПД»:
количество ТP = 507;
количество FP = 0 + 0 + 0 = 0;
количество FN = 6 + 1 + 10 = 17;
количество TN = 524 + 524 + 524 = 1572
Класс «СФ»:
количество ТP = 508;
количество FP = 6 + 0 + 0 = 6;
количество FN = 0 + 12 + 4 = 16;
количество TN = (524 – 6) + 524 + 524 =1566
Класс «АКТ»:
количество ТP = 488;
количество FP = 1 + 12 + 11 = 24;
количество FN = 0 + 0 + 36 = 36;
количество TN = (524 – 1) + (524 – 12) + (524 – 11) = 1548
Класс «Undefined»:
количество ТP = 513;
количество FP = 10 + 4 + 36 = 50;
количество FN = 0 + 0 + 11 = 11;
количество TN = (524 – 10) + (524 – 4) + (524 – 36) = 1522
В табл. 7 представлены результаты рассчитанных исходов для каждого класса документов. После расчета исходов по формулам (4)–(8) были рассчитаны метрики функциональной корректности ПК «ЭКО-ДОК» как СИИ в за- дачах классификации и распознавания документов, результаты расчета представлены в табл. 8.
Также в табл. 8 представлены результаты тестирования (результаты оценки характеристик) ПК как «ЭКО-ДОК» как СИИ.
Таблица 7
Результаты исходов
Тип исхода | Обозначение | Класс документа | |||
---|---|---|---|---|---|
«УПД», шт. | «СФ», шт. | «АКТ», шт. | «Undefined», шт. | ||
Количество истинно положительных исходов | TP | 507 | 508 | 488 | 513 |
Количество ложно положительных исходов | FP | 0 | 6 | 24 | 50 |
Количество ложно отрицательных исходов | FN | 17 | 16 | 36 | 11 |
Количество истинно отрицательных исходов | TN | 1572 | 1566 | 1548 | 1522 |
Таблица 8
Результаты тестирования ПК «ЭКО-ДОК» как СИИ
Тип метрики функциональной корректности | Обозначение | Класс документа | Критерий оценки | Результат тестирования | |||
---|---|---|---|---|---|---|---|
«УПД», шт. | «СФ», шт. | «АКТ», шт. | «Undefined», шт. | ||||
Доля правильных исходов | А | 0,992 | 0,990 | 0,971 | 0,971 | не менее 0,9 | Успешно |
Точность | Pr | 1,0 | 0,988 | 0,953 | 0,911 | не менее 0,9 | Успешно |
Полнота | Se | 0,968 | 0,969 | 0,931 | 0,979 | не менее 0,9 | Успешно |
Избирательность | Sp | 1,0 | 0,996 | 0,985 | 0,968 | не менее 0,9 | Успешно |
F-мера | F | 0,984 | 0,979 | 0,942 | 0,944 | не менее 0,9 | Успешно |
Этап 5
После проведения тестирования ПК «ЭКО-ДОК» были оформлены протоколы тестирования, в которых предоставлена сводка выполнения тестирования и результаты оценки качества ПК «ЭКО-ДОК».
Анализ результатов оценки качества ПК «ЭКО-ДОК» на этапе 1 показал, что ПК «ЭКО-ДОК» выдержал испытания и успешно классифицирует и распознает одностраничные документы типа «УПД», «СФ» и «АКТ».
Анализ результатов оценки качества ПК «ЭКО-ДОК» как СИИ на этапе 2 показал, что ПК «ЭКО-ДОК» выдержал испытания и успешно классифицирует и распознает одностраничные документы типа «УПД», «СФ» и «АКТ».
Таким образом установлено, что ПК «ЭКО-ДОК» успешно классифицирует и распознает одностраничные документы типа «УПД», «СФ» и «АКТ».
Заключение
Теоретическая значимость проведенных исследований заключается в разработанной методике, с помощью которой возможно провести оценку качества различных программных продуктов, имеющих в своем составе искусственный интеллект, в задачах классификации и распознавания документов и сравнить данные программные продукты. Также определены характеристики качества, показатели качества, элементы показателя качества, метрики, необходимые для оценки качества программного продукта.
Практическая значимость заключается в полученных результатах оценки качества ПК «ЭКО-ДОК», имеющего в своем составе сервис с нейронной сетью YOLO v5, в задачах классификации и распознавания документов.
Результаты исследования в данной области имеют большое значение для выработки рекомендаций по оценке качества программных продуктов и сравнению программных продуктов, имеющих в своем составе искусственный интеллект, в задачах классификации и распознавания документов.
Список литературы
1. Gezici B., Tarhan A. K. Systematic literature review on software quality for AI-based software // Empir Software 2022. Vol. 27, № 66. doi: 10.1007/s10664-021-10105-2
2. Вентцель Е. С. Теория вероятностей: учебник. 11-е изд., стер. М.: КНОРУС, 664 с.
3. Мхитарян В. С., Шишов В. Ф., Козлов А. Ю., Искоркин Д. В. Теория вероятностей и математическая статистика с использованием MS Excel: в 2 ч. Ч. 1. Теория вероятностей: учебник. М.: КУРС, 2019. 240 с.
4. Симанков В. С., Бучацкая В. В., Теплоухов С. В. Определение оптимального со- четания доверительного интервала и доверительной вероятности // Вестник Ады- гейского государственного университета. Серия: естественно-математические науки. 2019. № 3 (246). С. 69‒74.
References
1. Gezici B., Tarhan A.K. Systematic literature review on software quality for AI-based software. Empir Software Eng. 2022;27(66). doi: 10.1007/s10664-021-10105-2
2. Venttsel’ E.S. Teoriya veroyatnostey: uchebnik. 11-e izd., ster. = Probability theory: textbook. The 11th Moscow: KNORUS, 2010:664. (In Russ.)
3. Mkhitaryan V.S., Shishov V.F., Kozlov A.Yu., Iskorkin D.V. Teoriya veroyatnostey i matematicheskaya statistika s ispol’zovaniem MS Excel: v 2 ch. Ch. 1. Teoriya ve- royatnostey: uchebnik = Probability theory and mathematical statistics using MS Excel: in 2 parts. Part 1. Probability theory: textbook. Moscow: KURS, 2019:240. (In Russ.)
4. Simankov S., Buchatskaya V.V., Teploukhov S.V. Determining the optimal combina- tion of confidence interval and confidence probability. Vestnik Adygeyskogo gosudar- stvennogo universiteta. Seriya: estestvenno-matematicheskie nauki = Bulletin of Adygei State University. Series: natural and mathematical sciences. 2019;(3):69‒74. (In Russ.)
Информация об авторах / Information about the authors
Александр Николаевич Милованов
кандидат технических наук, системный аналитик, ООО «Логстрим» (Россия, Москва, ул. Кржижановского, 15, корп. 1)
E-mail: amilovanov@logstream.ru
Aleksandr N. Milovanov
Candidate of engineering sciences, systems analyst, “Logstream” LLC (building 1, 15 Krzhizhanovsky street, Moscow, Russia)
Алексей Анатольевич Мистюков
технический директор, ООО «Логстрим» (Россия, Москва, ул. Кржижановского, 15, корп. 1)
E-mail: amistyukov@logstream.ru
Aleksey A. Mistyukov
Engineering director, “Logstream” LLC (building 1, 15 Krzhizhanovsky street, Moscow, Russia)
Дмитрий Александрович Трусов
исполнительный директор, ООО «Логстрим» (Россия, Москва, ул. Кржижановского, 15, корп. 1)
E-mail: dtrusov@logstream.ru
Dmitriy A. Trusov
Chief executive, “Logstream” LLC (building 1, 15 Krzhizhanovsky street, Moscow, Russia)
Алексей Александрович Коршунов
специалист по тестированию, ООО «Логстрим» (Россия, Москва, ул. Кржижановского, 15, корп. 1)
E-mail: akorshunov@logstream.ru
Aleksey A. Korshunov
Testing specialist, “Logstream” LLC (building 1, 15 Krzhizhanovsky street, Moscow, Russia)
Авторы заявляют об отсутствии конфликта интересов / The authors declare no conflicts of interests.
Поступила в редакцию / Received 28.02.2024
Поступила после рецензирования и доработки / Revised 23.03.2024
Принята к публикации / Accepted 17.04.2024
Мистюков Алексей Анатольевич
Основатель компании.
Образование
Высшее Международный университет природы, общества и человека «Дубна», 2002 г., магистр, Институт системного анализа и управления, направление Системный анализ и управление.
Компетенции/профессиональные навыки:
- Более 20 лет автоматизации процессов обработки документов и бизнес-данных в различных отраслях экономики
- Управление командой
- Реализация масштабных проектов
Мальцев Сергей Викторович
Руководитель/владелец продукта ЭКО-ДОК OCR.
Образование:
Высшее Московский авиационный институт (национальный исследовательский университет) – инженер.
Компетенции/профессиональные навыки:
Управление человеческими ресурсами.
Бюджетирование проектов.
Митигация рисков.
Проектное планирование.
Ведение документооборота в рамках проекта.
Проектный опыт:
ООО «Логстрим» – Разработка интеллектуальной системы ЭКО-ДОК OCR для распознавания и извлечения данных из структурированных и неструктурированных документов с помощью нейронных сетей и машинного обучения.
АО «Финам» – Внедрение и поддержка автоматизированной системы сканирования и распознавания документов на базе Kofax Capture и Kofax Transformation Modules.
ООО «Нордголд Менеджмент» – Внедрение программного решения «Платформа по роботизации процессов» «RPA» на базе программных продуктов Kofax, автоматизация и техническая поддержка автоматизированных процессов.
ПАО «ГМК «Норильский никель» – Автоматизация процесса «Управление инвестиционными комитетами и контроль исполнения инвестиционных решений в части инвестиционных проектов и мероприятий на предприятиях Группы компаний «Норильский никель».
АО «Финам» – Внедрение платформы SaluteSpeech, с технологиями распознавания речи (Automatic Speech Recognition, ASR) и генерации речи (Text to speech, TTS).
АО «Финам» – Внедрение Системы коммуникаций «Express», предназначенной для предоставления пользователям программного сервиса мгновенного защищенного обмена сообщениями и файлами с использованием мобильных устройств и ПК.
Минаева Анна Владимировна
Руководитель проектов.
Образование:
Высшее Международный институт экономики и права. Всероссийская академия внешней торговли.
Компетенции/профессиональные навыки:
В сфере IT с 2005г. Начало IT карьеры в компании МегаФон. В 2015 г. пришла в компанию Логстрим на позицию Руководитель проектов.
Проектный опыт:
Участник проектов:
- ПАО «МегаФон»
- ПАО «ГМК «Норильский никель»
- ПАО «Магнит»
- ПАО «Северсталь»
- ООО УК «МЕТАЛЛОИНВЕСТ»
Трусов Дмитрий Александрович
Исполнительный директор.
Проектный опыт:
- Общий стаж практики в консалтинге – 17 лет, более 11 лет опыта автоматизации ОЦО в РФ и странах СНГ.
- Опыт проектов внедрения промышленных систем ERP, ECM, OCR, RPA и пр.
- Участие в проектах ОЦО: ПАО «Северсталь», ПАО «ГМК «Норильский никель», ПАО «Магнит», ПАО «МегаФон», ООО УК «МЕТАЛЛОИНВЕСТ»
Степанов Андрей Олегович
Руководитель проектов.
Проектный опыт:
- Участие в разработке и внедрении ИС HR блока крупной организации
- Участие в крупных проектах в качестве функционального эксперта
Скрыпник Иван Александрович
Архитектор программного обеспечения.
Проектный опыт:
- Общий стаж практики автоматизации документооборота более 14 лет.
- Участие в проетах ОЦО: ПАО «МегаФон», АО «Первая башенная компания», ПАО «Магнит».
- Сертификаты: Kofax Capture, Kofax Transformation Modules, Kofax Insight и Kofax RPA.
Алексеев Андрей Сергеевич
Руководитель направления по администрированию IT систем.
Образование:
Высшее Саратовский Государственный Технический университет имени Гагарина Ю.А.
Компетенции/профессиональные навыки:
- Знания операционных систем Linux (Ubuntu, CentOS) и Windows Server.
- Опыт работы с облачными платформами
- Контейнеризации с Docker, оркестрация Kubernetes
- Развитие профессиональных навыков сотрудников.
- Регулярные обучающие программы, система поощрений и мотивации.
- Эффективное взаимодействие с заказчиками и командой.
- Разработка стратегических планов, анализ рисков
Проектный опыт:
- ПАО «Магнит»
- ООО «Группа Компаний «Русагро»
- ПАО «Северсталь»
- ООО «Сахалинская Энергия»
- ПАО «ГМК «Норильский никель»
- АПХ «Мираторг»
- ПАО «Газпром нефть»
История работы в компании:
В начале своего пути в компании, я занял позицию специалиста в области IT. Это были увлекательные времена, когда я активно изучал и внедрял новые технологии в сфере разработки и DevOps. Мои компетенции и профессиональные навыки не остались незамеченными, и благодаря своему усердию и преданности, я был продвинут в руководящую должность. В настоящее время я продолжаю развиваться и принимать активное участие в новых проектах. Моя история в компании — это не только путь от сотрудника до руководителя, но и постоянное стремление к новым вызовам и поиску инновационных решений. Я горжусь своим профессиональным ростом здесь и уверен в успешном будущем, продолжая развиваться в новых проектах и привносить свой вклад
Полковников Евгений Николаевич
Ведущий системный аналитик.
Образование:
Высшее 2011 Саратовский государственный аграрный университет им. Н.И. Вавилова, Саратов. Бух.учет, анализ, аудит.
Компетенции/профессиональные навыки:
- Сбор и формализация требований
- Моделирование процессов (нотации): EPC, BPMN, UML
- Расчет эффективности процессов
- Интеграция:
Протоколы: SOAP, REST
Формат: XML, JSON (чтение, написание XSD)
Виды: Синхрон/Асинхрон - Методологии разработки: Agile, Waterfall, Incremental
- Моделирование интерфейсов
- Написание SQL запросов
- Написание документов:
Функционально-технические требования
Техническое задание
Проектное решение
Спецификация на интеграцию
Программа и методика испытаний
Программа обучения пользователей
Инструкция пользователя - Проведение презентаций и показов
- Работа с программным обеспечением:
Средства визуализации и распознавания текста: Kofax 10.0, Kofax KTM 6, ABBY FineReader
Средства MS Office: Word, Exel, Visio, PowerPoint, Project
Отрисовка процессов: Visio, Astah, Aris, Archimate
Базы данных: MySQL, ORACLE.
Менеджеры БД (уровень пользователя): DBeaver, MySQL
ECM системы: OpenText by Sap xECM, Lotus Notes.
Проектный опыт:
- ООО «Лента» (04.2022 – 06.2022): внедрение Системы Электронного документооборота и Электронного архива юридически значимых электронных документов на базе продуктов WSS Docs.
- ФАУ «Российский морской регистр судоходства» (03.2022 – наст. вр): создание единой целевой Системы Электронного документооборота и Электронного архива на базе продуктов OpenText.
- ООО «КСК» (10.2021 – 04.2022): Консалтинг и реализация проекта по Кадровому Электронному Документообороту в 1С, интеграция продуктов 1С ЗУП, 1С ДО и сервиса подписания документов электронной подписью Sign.me.
- АО «Тандер» (10.2021-по наст.вр.):Внедрение Системы Электронного документооборота и Электронного архива первичных бухгалтерских документов на базе продуктов OpenText и Kofax.
- ПАО «ГМК «Норильский никель» (02.2020 – по наст.вр.):реализация конвертера для перевода документов налогового мониторинга в xml.
- ПАО «ГМК «Норильский никель» (08.2015 – по наст.вр.): Разработка и внедрение системы обработки документов (СОД), интегрированной с целевыми системами управления ресурсами предприятия SAP ERP и 1С.
- ООО «TNK-BP Бизнессервис» (2012-2014): внедрение платформы Kofax Capture и Kofax Transfomation Modules в ТНК. Реализация интеграции с системами SAP, Lotus notes.
История работы в компании:
В компании с июня 2012 года, начинал с позиции младшего аналитика, сейчас являюсь ведущим системным аналитиком и руководителем отдела аналитики. С 2021 года провожу курсы системного анализа в несколько ВУЗах.
Чех Анатолий Игоревич
Инженер-программист.
Образование:
Высшее
Санкт-Петербургский государственный электротехнический университет «ЛЭТИ».
Магистр прикладной математики и информатики.
Компетенции/профессиональные навыки:
- BI плтаформы: Visiology, Power BI, Tableau, Biom
- SQL: Postgre, MS SQL, Oracle, My SQL
- 1C-витрины данных и построение отчетности
- Разработка Фронт (Html, TypeScript/JavsScript, CSS)
- Разработка Бэкенд – C#, ASP.NET Core
- Моделирование и прогнозная аналитика: R
Проектный опыт:
- ПАО «МегаФон», Консультация по аналитической платформы, рекомендации и поддержка по внедрению.
- ООО УК «МЕТАЛЛОИНВЕСТ» – разработка аналитической отчетности для систем электронного документооборота (СЭД).
- ПАО «ГМК «Норильский никель» – разработка и внедрение аналитической отчетности для систем электронного документооборота (СЭД) и электронной канцелярии (ЭК)
- АО «Тандер» – разработка и внедрение аналитической отчетности для систем электронного документооборота и электронного архива первичных бухгалтерских / кадровых документов
- Biom – разработка, подержка, внедрение платформы для реализации аналитической отчетности «Biom Аналитическая платформа»
История работы в компании:
С 2015 года в качестве консультанта, с 2022 года в качестве штатного сотрудника.
Чех Анатолий Игоревич
Инженер-программист.
Образование:
Высшее
Санкт-Петербургский государственный электротехнический университет «ЛЭТИ».
Магистр прикладной математики и информатики.
Компетенции/профессиональные навыки:
- BI плтаформы: Visiology, Power BI, Tableau, Biom
- SQL: Postgre, MS SQL, Oracle, My SQL
- 1C-витрины данных и построение отчетности
- Разработка Фронт (Html, TypeScript/JavsScript, CSS)
- Разработка Бэкенд – C#, ASP.NET Core
- Моделирование и прогнозная аналитика: R
Проектный опыт:
- ПАО «МегаФон», Консультация по аналитической платформы, рекомендации и поддержка по внедрению.
- ООО УК «МЕТАЛЛОИНВЕСТ» – разработка аналитической отчетности для систем электронного документооборота (СЭД).
- ПАО «ГМК «Норильский никель» – разработка и внедрение аналитической отчетности для систем электронного документооборота (СЭД) и электронной канцелярии (ЭК)
- АО «Тандер» – разработка и внедрение аналитической отчетности для систем электронного документооборота и электронного архива первичных бухгалтерских / кадровых документов
- Biom – разработка, подержка, внедрение платформы для реализации аналитической отчетности «Biom Аналитическая платформа»
История работы в компании:
С 2015 года в качестве консультанта, с 2022 года в качестве штатного сотрудника.
Поддержка системы ввода и обработки invoices на платформе Readsoft Process Director
Цели и задачи:
- Поддержка работоспособности системы 24/7
- Доработка текущего функционала
- Внедрение нового функционала.
Функциональный заказчик:
- Северсталь ЦЕС
Используемые решения:
- ReadSoft Invoices
- Kofax Capture
- SAP ERP
Техническая поддержка системы электронного документооборота созданной на базе платформы Kofax
Цели и задачи:
- Поддержка работоспособности системы, по обращениям Заказчика согласно утвержденному SLA
- Реализация запросов на изменение (ЗНИ)
Функциональный заказчик:
- Департамент информационных технологий
Используемые решения:
- Kofax Capture
- Kofax KTM
Поддержка платформы Kofax в ПАО «Мегафон»
Цели и задачи:
- Техническая поддержка работоспособности системы
- Доработка текущего функционала,
Функциональный заказчик:
- Финансовый департамент
Используемые решения:
- Kofax Capture
- Kofax KTM
Поддержка платформы Kofax Capture для автоматизации обработки первичных финансовых документов (инвойсы и упаковочные листы)
Цели и задачи:
- Обновление версий платформы
- Техническая поддержка платформы
- Развитие функциональности на платформе
Используемые решения:
- Kofax Capture
- Kofax Transformation Modules
- Kofax Import Connector
- Saperion
- 1С ShipDocs
Доработка СЭД: автоматическое создание и архивация договоров
Цели и задачи:
- Обновление системы ОТ с версии 10.5 до 21.3
- Развитие системы и разработка новых функциональных модулей
Функциональный заказчик:
- Отдел развития СЭД Х5 Retail Group
Используемые решения:
- SAP xECM (OpenText Content Server)
- SAP ERP
Техническая поддержка и реализация запросов на изменение
Цели и задачи:
- Поддержка работоспособности системы
- Обновление версий ПО
- Выставление запросов Вендору продуктов
- Доработка текущего функционала
- Внедрение нового функционала
- Обновление функционала до актуальных версий ПО.
Функциональный заказчик:
- Центр Единого Сервиса «Северсталь».
Используемые решения:
- Koofax ReadSoft Invoices for SAP
- Kofax Capture
- Kofax Process Director
- Kofax RPA
Поддержка и развитие системы электронного документооборота и электронного архива на платформе OpenText, Kofax
Цели и задачи:
- Поддержка работоспособности системы 24/7
- Доработка текущего функционала
- Внедрение нового функционала
Используемые решения:
- ОpenText Content Server
- Kofax Capture
- Kofax KTM
- Kofax RPA
- Kofax BI
Поддержка и развитие системы внутреннего электронного документооборота на платформе OpenText
Цели и задачи:
- Поддержка работоспособности системы 24/7
- Обновление системы на новую версию
- Доработка текущего функционала
- Внедрение нового функционала
Функциональный заказчик:
- IT, Группа СЭД
- Департамент внутреннего контроля и управления рисками
- Отдел методологии и автоматизации учета
- Бухгалтерия
Используемые решения:
- OpenText Content Server
Поддержка и развитие системы внутреннего электронного документооборота на платформе OpenText
Цели и задачи:
- Поддержка работоспособности системы 24/7
- Обновление системы
- Доработка текущего функционала
- Внедрение нового функционала
Функциональный заказчик:
- Группа развития и сопровождения информационных систем электронного документооборота
Используемые решения:
- OpenText Content Server
Поддержка и развитие системы внутреннего электронного документооборота на платформе OpenText
Цели и задачи:
- Поддержка работоспособности системы 24/7
- Доработка текущего функционала
- Внедрение нового функционала
Функциональный заказчик:
- Департамент Автоматизации и информационных систем
Используемые решения:
- OpenText Content Server
Поддержка и миграция OpenText Content Server
Цели и задачи:
- Поддержка работоспособности системы
- Миграция платформы на ОС Астра Linux и СУБД PostgreSQL
Функциональный заказчик:
- Поддержка работоспособности системы
Миграция платформы на ОС Астра Linux и СУБД PostgreSQL
Используемые решения:
- SAP xECM (OpenText Content Server)
Техническая поддержка и реализация запросов на изменение проекта "Система обработки документов" (СОД) на базе OpenText
Цели и задачи:
- Поддержка работоспособности системы 24/7
- Обновление версии
- Доработка текущего функционала
- Внедрение нового функционала
- Обеспечение работоспособности системы в регионах с низкой пропускной способностью каналов связи
Функциональный заказчик:
- Управление методологии и организации делопроизводства ПАО «ГМК “Норильский никель»
Используемые решения:
- SAP xECM (OpenText Content Server)
- Kofax Capture
- Kofax KTM
- Управление методологии и организации делопроизводства ПАО «ГМК “Норильский никель»
ООО «Металлоинвест корпоративный сервис»
Цели и задачи
- Автоматизация обработки первичной бухгалтерской и кадровой; документации;
- Стандартизация и автоматизация обработки входящей документации;
- Построение единого информационного архива скан-образов и электронных дубликатов документов;
- Связь электронного архива с учетной системой.
Результат
- Создана единая информационная база;
- Время на сканирование и заполнение карточек в ЭДО снизилось в 3 раза;
- Сокращение затрат в первый год на 20%;
- Сокращение FTE в первый год на 28%.
Функции, переведенные в ОЦО
- Бухгалтерский и налоговый учет;
- Фабрика платежей;
- Управление персоналом;
- Экономическая безопасность;
- Договорная работа;
- Администрирование закупочной деятельности.
Время реализации
10 месяцев.
ПАО «ГМК» Норильский никель
Цели и задачи
- Обеспечение централизованной автоматизированной обработки и хранения первичной бухгалтерской и кадровой документации;
- Стандартизация и автоматизация обработки документации с момента поступления до сдачи оригиналов в архив;
- Создание единого информационного пространства для хранения скан-образов документов;
- Интеграция с корпоративными учетными системами SAP ERP, SAP HCM, 1C УПП.
Результат
- Централизация службы поддержки пользователей СОД;
- Снижение затрат на сопровождение системы;
- Контроль целостности электронного и бумажного архива;
- Поиск места физического хранения оригиналов документов по системным данным;
- Снижение трудовых затрат на подбор оригиналов.
Функции, переведенные в ОЦО
- Бухгалтерский учет;
- Финансовый учет.
Время реализации
11 месяцев.
ПАО «Магнит»
Цели и задачи
- Централизация сервисных функций компании – создание ОЦО;
- Отказ от бумажных документов и переход на электронный документооборот и электронные подписи;
- Автоматизация обработки документов;
- Создание масштабируемой платформы электронного документооборота;
- Создание единого электронного архива.
Результат
- Централизация бухгалтерской функции в ОЦО;
- Общее снижение расходов на печать бумажных документов;
- Сокращение времени доставки документа на обработку в ОЦО;
- Снижение количества ошибок при вводе документа в учетную систему.
Функции, переведенные в ОЦО
- Бухгалтерский учет;
- Финансовый учет.
Время реализации
9 месяцев.
ПАО «ГМК» Норильский никель
Цели и задачи
- Обеспечение централизованной автоматизированной обработки и хранения первичной бухгалтерской и кадровой документации;
- Стандартизация и автоматизация обработки документации с момента поступления до сдачи оригиналов в архив;
- Создание единого информационного пространства для хранения скан-образов документов;
- Интеграция с корпоративными учетными системами SAP ERP, SAP HCM, 1C УПП.
Результат
- Централизация службы поддержки пользователей СОД;
- Снижение затрат на сопровождение системы;
- Контроль целостности электронного и бумажного архива;
- Поиск места физического хранения оригиналов документов по системным данным;
- Снижение трудовых затрат на подбор оригиналов.
Функции, переведенные в ОЦО
- Бухгалтерский учет;
- Финансовый учет.
Время реализации
11 месяцев.
ПАО «ГМК» Норильский никель
Цели и задачи
- Обеспечение централизованной автоматизированной обработки и хранения первичной бухгалтерской и кадровой документации;
- Стандартизация и автоматизация обработки документации с момента поступления до сдачи оригиналов в архив;
- Создание единого информационного пространства для хранения скан-образов документов;
- Интеграция с корпоративными учетными системами SAP ERP, SAP HCM, 1C УПП.
Результат
- Централизация службы поддержки пользователей СОД;
- Снижение затрат на сопровождение системы;
- Контроль целостности электронного и бумажного архива;
- Поиск места физического хранения оригиналов документов по системным данным;
- Снижение трудовых затрат на подбор оригиналов документов и подготовку описей.
Функции, переведенные в ОЦО
- Бухгалтерский учет;
- Финансовый учет.
Время реализации
11 месяцев.
Цели и задачи
Внедрение целевой системы хранения и обмена электронными документами по единым стандартам с возможностью дальнейшего развития:
- Централизация сервисных функций компании – создание ОЦО
- Отказ от бумажных документов и переход на электронный документооборот и электронные подписи
- Автоматизация обработки документов
- Создание масштабируемой платформы электронного документооборота
- Создание единого электронного архива
Результат
- Централизация бухгалтерской функции в ОЦО
- Общее снижение расходов на печать бумажных документов
- Сокращение времени доставки документа на обработку в ОЦО
- Снижение количества ошибок при вводе документа в учетную систему
Функции, переведенные в ОЦО
- Бухгалтерский учет
- Финансовый учет
Время реализации
Цели и задачи
- Обеспечение централизованной автоматизированной обработки и хранения первичной бухгалтерской и кадровой документации
- Стандартизация и автоматизация обработки документации с момента поступления до сдачи оригиналов в архив
- Создание единого информационного пространства для хранения скан-образов документов
- Интеграция с корпоративными учетными системами SAP ERP, SAP HCM, 1C УПП
Результат
- Централизация службы поддержки пользователей СОД
- Снижение затрат на сопровождение системы
- Контроль целостности электронного и бумажного архива
- Поиск места физического хранения оригиналов документов по системным данным
- Снижение трудовых затрат на подбор оригиналов документов и подготовку описей
Функции, переведенные в ОЦО
- Бухгалтерский учет
- Финансовый учет
Время реализации
11 месяцев
Цели и задачи
- Автоматизация обработки первичной бухгалтерской и кадровой документации
- Стандартизация и автоматизация обработки входящей документации
- Построение единого информационного архива скан-образов и электронных дубликатов документов
- Связь электронного архива с учетной системой
Результат
- Создана единая информационная база
- Время на сканирование и заполнение карточек в ЭДО снизилось в 3 раза
- Сокращение затрат в первый год на 20%
- Сокращение FTE в первый год на 28%
Функции, переведенные в ОЦО
- Бухгалтерский и налоговый учет
- Фабрика платежей
- Управление персоналом
- Экономическая безопасность
- Договорная работа
- Администрирование закупочной деятельности
Время реализации
10 месяцев