Назад

ABBYY FlexiCapture

ABBYY

ABBYY FlexiCapture – решение для потокового ввода данных и документов. Продукт автоматизирует извлечение информации из бумажных документов и сохраняет данные в информационной системе предприятия. ABBYY FlexiCapture позволяет различным организациям, в том числе крупным корпорациям, правительственным структурам и образовательным учреждениям, автоматизировать процесс ввода данных в информационные системы, снизить затраты и повысить качество обслуживания клиентов.

Основные преимущества

ABBYY FlexiCapture - решение для потокового ввода данных и документов, которое автоматически извлекает информацию из бумажных документов и сохраняет ее в информационную систему предприятия.

ABBYY FlexiCapture позволяет различным организациям, в том числе крупным корпорациям, правительственным структурам и образовательным учреждениям, автоматизировать процесс ввода данных в информационные системы, снизить затраты и повысить качество обслуживания клиентов.

ABBYY FlexiCapture представляет собой единый центр потокового ввода данных и позволяет обрабатывать любые типы документов вне зависимости от структуры:

  • Документы с жесткой структурой или структурированные документы: анкеты, экзаменационные тесты, бланки, страховые формы, запросы на выплату медицинской страховки, налоговые декларации и т.п.
  • Слабоструктурированные документы: счета, заказы на покупку, транспортные накладные и т.п.
  • Неструктурированные документы: письма, контракты, статьи т.п.

Процесс работы с ABBYY FlexiCapture состоит из нескольких этапов: на первом этапе происходят установка системы и настройка гибких описаний для обработки документов. После того как создан проект со всеми настройками и шаблонами, все типы документов могут обрабатываться в одном потоке.  Стандартные этапы обработки документов включают импорт изображений из различных источников, распознавание, верификацию и экспорт полученных данных в различные информационные системы

ABBYY FlexiCapture: создание гибких описаний и настройка

Процедура ввода и обработки данных в ABBYY FlexiCapture состоит из двух этапов – подготовительной стадии и стадии обработки. За отдельные стадии обычно отвечают разные пользователи – администратор и операторы.

  • Режим администратора предназначен для настройки всего процесса потокового ввода данных, подготовки гибких описаний документов и предварительного тестирования. Этот режим используется на подготовительной стадии и обеспечивает полный доступ ко всем возможностям системы, включая настройки обработки и инструменты для создания гибких описаний.
  • Режим оператора предназначен только для операций по вводу и обработке данных, в частности для импорта/сканирования документов, распознавания, верификации результатов распознавания и экспорта полученных данных. В этом режиме пользователь «общается» с программой посредством простого и интуитивно понятного интерфейса, который делает ежедневную работу с программой максимально удобной и неутомительной.

На этапе настройки задаются правила обработки и осуществляется подготовка гибких описаний документов. Как правило, вышеперечисленные задачи выполняются администратором, который создает гибкие описания для всех типов документов, которые будут обрабатываться в рамках конкретного проекта.

В ABBYY FlexiCapture имеется набор инструментов для разработки и настройки гибких описаний различных документов:

  • ABBYY FormDesigner 

ABBYY FormDesigner (дизайнер форм) – модуль для создания и тиражирования бланков так называемой «жесткой» формы, которые предназначены для заполнения от руки. ABBYY FormDesigner позволяет создавать широкий спектр бланков: черно-белые и цветные, линейчатые и растровые, одно- и многостраничные.

Новая версия ABBYY FormDesigner позволяет обрабатывать не только бумажные формы, но и электронные. С помощью специального приложения ABBYY FormDesigner возможно самостоятельно создавать формы в формате PDF, которые могут быть использованы, например, для заполнения форм в Интернете.

  • ABBYY FlexiLayout Studio 

ABBYY FlexiLayout Studio – мощный инструмент по созданию гибких описаний для документов с нежесткой структурой, то есть тех документов, на которых расположение однотипных данных может варьироваться от одного экземпляра к другому. Для гибких описаний в интерфейсе программы принято название FlexiLayout. Гибкое описание FlexiLayout позволяет системе извлекать из документов с нежесткой структурой необходимые данные, как то: текстовые строки, штрихкоды, даты, валютные символы, числа, разделители, таблицы.

Например, используя лишь одно гибкое описание программа может найти все необходимые поля на счетах, поступающих от разных поставщиков и имеющих разный формат, даже если это многостраничные документы. ABBYY FlexiLayout Studio предлагает эффективные и удобные средства для тестирования и настройки гибких описаний на наборе изображений документов: дерево гипотез, эталонные описания, язык FlexiLayout.

Реализованные в ABBYY FlexiCapture технологии самообучения системы позволяют не только автоматизировать процесс создания описаний документов, но и дают возможность специалистам редактировать такие описания сразу после их создания для улучшения результата работы системы в дальнейшем. Это существенно сокращает сложность выполнения данного этапа работы и его длительность.

  • Document Definition Editor 

Document Definition Editor (редактор определения документов) – специальный модуль для создания определений документов любого типа. С его помощью Администратор может настроить правила обработки, указывающие программе, как идентифицировать отдельный тип документов в общем потоке данных и какие операции необходимо совершить с этим этими документами в процессе обработки. Администратор также может указать, какие данные необходимо извлечь и как их следует распознавать, проверять, верифицировать и экспортировать.

Обработка документов

Импорт документов: сканирование, e-mail, обычная и «горячая» папка

Бумажные документы могут быть импортированы в программу при помощи сканирующего устройства (сканера или МФУ), поддерживающего протокол сканирования TWAIN или ISIS.  Изображения документов также могут быть добавлены вручную из обычной папки, где они хранятся, либо автоматически из «горячей» папки.

Поддержка MAPI и POP3 позволяет отправлять изображения в систему по электронной почте. Кроме этого, через МФУ с функцией scan-to-email можно отправить на обработку вручную отсканированные изображения.

Поддерживаемые графические форматы: PDF, BMP, PCX, PNG, JPEG, JPEG 2000, DjVu и TIFF, DCX. Операция импорта может быть упрощена и автоматизирована при помощи набора профилей импорта с заранее заданными настройками.

Кроме централизованного сканирования ABBYY FlexiCapture предлагает удаленный импорт документов, который идеально подходит для нужд крупных компаний с распределенной структурой или распределенными бизнес-процессами, предполагающими сканирование документов в точках входа и последующую их централизованную обработку. Оператор инсталлирует и запускает клиента сканирования простым щелчком по ссылке на веб-странице. Установка полностью автоматизирована и не требует на компьютере административных привилегий. Профили импорта могут настраиваться локально оператором сканирования или назначаться централизованно с сервера.

Распознавание документов

В ABBYY FlexiCapture встроена технология распознавания печатных символов (OCR) почти для 190 языков и технологию интеллектуального распознавания рукопечатных символов (ICR) для более чем 110 языков, а также технологии распознавания штрихкодов (1D и 2D), распознавания меток и полнотекстового распознавания неструктурированных документов с последующим экспортом в формат PDF с возможностью полнотекстового поиска.

Стадия распознавания включает в себя предварительную обработку изображения, классификацию документов и извлечение из них данных и текста с последующим автоматическим контролем данных. Все эти операции выполняются автоматически и могут осуществляться в фоновом режиме.

  • Предварительная обработка изображений

Импортированные изображения документов могут быть подвергнуты предварительной обработке для обеспечения максимального качества распознавания. Предварительная обработка подразумевает ряд операций по корректировке ориентации страниц, инвертированию, удалению перекосов и шума.

  • Автоматическая классификация документов

ABBYY FlexiCapture накладывает существующие гибкие описания на импортированные изображения и собирает отдельные неупорядоченные страницы в документы. Для идентификации различных типов документов в обрабатываемом потоке используется технология интеллектуального распознавания документов (IDR, Intelligent Document Recognition) и технология FlexiCapture. ABBYY FlexiCapture автоматически классифицирует документы с нежестко заданной структурой любой сложности, включая многостраничные документы с разным количеством страниц, многостраничные таблицы и документы, имеющие при себе приложения в виде картинок и текстов.

  • Извлечение данных и текста

После наложения шаблонов и обнаружения необходимых полей из них извлекаются данные при помощи высокоточных технологий многоязычного распознавания. Неструктурированные документы распознаются при помощи технологии полнотекстового распознавания для получения PDF-файлов с возможностью полнотекстового поиска.

  • Автоматический контроль данных

В процессе распознавания программа автоматически применяет правила контроля данных, заданные администратором на этапе разработки гибких описаний. Наиболее распространенные типы правил включают в себя проверку формата чисел и дат, проверку по базе данных, проверку сумм, замену значений из списка, нормализацию дат и цен. Для многих типов данных имеются словари разрешенных слов, которые также могут использоваться в процессе контроля данных.

Верификация данных

Когда распознавание закончено, каждому символу присваивается статус, отражающий надежность распознавания: символ может быть надежно распознанным, ненадежно распознанным или нераспознанным. Последние два статуса означают, что оператору необходимо подтвердить гипотезу системы или внести исправления. Этот этап требует больше ручного труда, чем остальные. Для ускорения и упрощения процесса верификации в ABBYY FlexiCapture встроен специальный верификационный интерфейс, которые предлагает три режима работы: групповая верификация (больше всего подходит для проверки меток и цифр), верификация полей (для проверки текстовых полей) и верификация в окне «Документ» (для корректировки правил).

В процессе верификации также осуществляется корректировка правил сборки с использованием уменьшенных изображений документов, корректировка правил контроля данных и ручное индексирование при помощи «ввода на основе изображения» (Key From Image, KFI).

Проверку неуверенно распознанных символов можно производить прямо в окне браузера. Веб-станция верификации данных не требует установки на компьютер пользователя и доступна везде, где есть Интернет.

Экспорт данных и архивирование документов

Извлеченные данные могут быть экспортированы во внешние базы данных (через ODBC) или в файлы, переданы в бизнес-приложения или системы электронного документооборота. Данные могут экспортироваться в чистом виде или вместе с приложенными изображениями и текстами. Документы могут сохраняться в архивы как файлы в формате PDF/PDF-A с возможностью полнотекстового поиска.  

ABBYY FlexiCapture 10 поддерживает широкий спектр форматов сохранения данных (XML, XLS, DBF, CSV, TXT) и изображений (TIFF, JPEG, JPEG 2000, PDF, PDF/A, PCX, BMP, PNG).

Системные требования

Форматы импорта

Документы могут быть не только отсканированы, но и загружены в систему из файлов изображений:

  • PDF: файлы формата PDF (версия 1.6 или более ранние)
  • BMP: чёрно-белый, серый, цветной
  • PCX: чёрно-белый, серый, цветной
  • PNG: чёрно-белый, серый, цветной
  • JPEG, JPEG 2000: серый, цветной
  • TIFF: чёрно-белый, серый, цветной, многостраничный. Способы сжатия: несжатый, CCITT Group 3, CCITT Group 4, PackBits, JPEG, ZIP, LVZ 
  • GIF: чёрно-белый, серый, цветной
  • DjVu: чёрно-белый, серый, цветной
  • DCX: чёрно-белый, серый, цветной
  • JBIG2
  • Microsoft HD photo
  • XPS 

Типы штрихкодов

Система распознает следующие типы штрихкодов:

  • Одномерные: Code 39, Check Code 39, Interleaved 25, Check Interleaved 25, EAN 8, EAN 13, Code 128, Codabar, Code 93, IATA 25, UCC Code 128, UPC-A, UPC-E, Matrix 2 of 5, Industial 2 of 5, PostNet, patch code (1, 2, 3, 4, T/Transfer, 6)
  • Двумерные: PDF 417, Aztec, Datamatrix

Типы текстов

Система распознает следующие типы текстов:

  • типографский
  • рукописный печатный
  • пишущая машинка
  • матричный принтер
  • индекс
  • OCR-A
  • OCR-B
  • MICR (E13B)
  • MICR (CMC7)

Форматы экспорта

Возможности экспорта данных:

  • файлы
  • SharePoint 2003/2007,2010
  • база данных
  • любое внешнее приложение (API, использование скриптов)

Форматы экспорта данных:

  • TXT
  • XLS
  • DBF
  • CSV
  • XML

Форматы экспорта изображений:

  • PDF, PDF/A (только изображение, текст под изображением)
  • TIFF
  • JPEG
  • PCX
  • BMP
  • PNG
  • JPEG 2000

Языки распознавания

ABBYY FlexiCapture распознаёт печатные тексты на 190 языках, а формы заполненные от руки – на 110 языках. Полный список языков доступен здесь.

Системные требования

1. ПК с процессором: Intel® Core™2/2 Quad/Pentium®/Celeron®/Xeon™, AMD 6/Turion™/Athlon™/Duron™/Sempron™, частота 2 GHz

2. Операционная система:

Для установки рабочих станций (локальная и сетевая установка):

  • Windows 7,
  • Windows Vista SP2,
  • Windows XP SP2

Для установки серверов (сетевая установка):

  • Windows Server 2008 SP2,
  • Windows Server 2003 SP2

Для работы с локализованным интерфейсом необходима поддержка соответствующего языка операционной системой.

3. Оперативная память:

  • 512 Мб для каждого процессора
  • Общий объем памяти минимум 1 Гб

4. Место на жестком диске:

  • Локальная установка: 1 Гб (включая 700 Mб для установки системы)
  • Сетевая установка (станции): 1 Гб (включая 800 Mб для установки системы)
  • Сетевая установка (серверы): 50 Мб для установки + 2 Гб для работы базы SQL

5. Сканер с поддержкой интерфейса TWAIN или ISIS.

6. Итернет-соединение для активации серийного номера при использовании программного ключа защиты или USB-порт при использовании аппаратного ключа защиты.

7. Видеокарта и монитор с минимальным разрешением 1024×768.

8. Клавиатура, мышь или иное устройство ввода.

Список поддерживаемых сканеров 

ABBYY FlexiCapture поддерживает широкий спектр TWAIN- и ISIS-сканеров.

Список протестированных TWAIN-сканеров находится здесь.

Наши контакты

Наш телефон: (4872) 40-59-59 (4872) 52-10-04
Наш адрес:

г. Тула, ул. Степанова, д. 34А, офис 2

Copyright © COMPANY BREVIS LLC. All Rights Reserved