Назад

ABBYY Recognition Server

ABBYY

ABBYY Recognition Server – серверное решение для распознавания текста и преобразования документов в электронные редактируемые форматы.

Основные преимущества

Архитектура решения

ABBYY Recognition Server состоит из нескольких компонентов, которые могут быть установлены на одной или разных машинах в локальной сети.

Менеджер сервера

Это ключевой компонент, который служит для управления всеми остальными компонентами системы, настройками обработки, а также распределением заданий между станциями обработки, сканирования, индексирования и верификации.

Станция обработки

Станция обработки представляет собой службу Windows, которая непосредственно осуществляет распознавание изображений. К одному менеджеру сервера можно подсоединить несколько  станций обработки; таким образом, комплекс легко масштабируется и его продуктивность возрастает.

Консоль удаленного администрирования

Представляет собой общий интерфейс администрирования для настройки системы и контроля ее работы. С ее помощью осуществляется:

  • конфигурирование системы;
  • создание сценариев обработки;
  • управление правами пользователей;
  • задание расписаний для сценариев обработки и станций обработки;
  • управление приоритетами заданий;
  • мониторинг работы системы, просмотр журнала событий.

Станция сканирования

Предназначена для потокового сканирования документов и предварительной обработки изображений. С нее документы направляются на станции обработки для дальнейшего распознавания.

Возможности станции сканирования

  • взаимодействие со сканерами, потоковое сканирование, автоматическое разделение пакета на документы;
  • контроль качества сканирования (с помощью окна «Изображение»);
  • обработка и улучшение изображений: поворот, исправление искажений;
  • удаление конфиденциальной информации;
  • автоматическое именование документов и папок: по дате и времени, по значению
  • штрих-кода.

Станция индексирования

Предназначена для присвоения распознанным документам типов и атрибутов. Если значение атрибута содержится в тексте документа, оператору достаточно курсором выделить нужные слова на изображении. При необходимости поле атрибута может быть заполнено вручную. Возможна также настройка автоматического заполнения атрибутов с помощью скриптов.

Станция верификации

Предназначена для контроля качества распознавания страниц, проверки орфографии и редактирования распознанного текста. При необходимости страница может быть отправлена на повторную обработку.

Этапы обработки документов

Процесс обработки документов включает в себя несколько последовательных этапов.

Получение изображений

  • Поддержка форматов PDF, BMP, PCX, PNG, DCX, JPEG, JPEG2000, TIFF, DjVu, GIF, JBIG2, WDP.
  • Сканирование через интерфейсы TWAIN, WIA, ISIS. В корпоративной сети может работать несколько станций сканирования одновременно.
  • Получение изображений из локальной или сетевой папки, в том числе из папок со сложной структурой (с вложенными подпапками), а также с FTP. При сохранении результатов в файловую систему программа автоматически повторяет структуру входящей папки.
  • Импорт документов, прикрепленных к письмам электронной почты.

Распознавание

  • Распознавание многоязычных документов на более чем 190 языках.
  • Увеличение скорости обработки изображений хорошего качества благодаря режиму быстрого распознавания.
  • Технология адаптивного распознавания (ADRT) позволяет анализировать документ как единое целое, полностью сохраняет его логическую структуру: оглавление, иерархию заголовков, номера страниц, нижние и верхние колонтитулы, а также стили шрифтов.
  • Поддерживается распознавание специальных типов текста: MICR (E13B), OCR-A, OCR-B, готические шрифты; машинописные тексты, а также полученные с факса и отпечатанные на матричном принтере.
  • Поддерживается распознавание наиболее распространенных одномерных и двумерных штрих-кодов.
  • Установка порога качества распознавания на основе допустимого количества неуверенно распознанных символов на страницу.
  • Контроль качества распознавания на станции верификации.

Определение типа документов и присвоение атрибутов

  • Разделение потока изображений на документы по пустым листам, разделительному штрих-коду, фиксированному количеству страниц или более сложным правилам, определенным через скрипт.
  • Автоматическое определение типа документа и присвоение атрибутов по правилам, определенным скриптом.
  • Возможность определения типа документа и задание атрибутов в ручном режиме на станции индексирования.

Публикация документов

  • Сохранение документов в различные форматы: DOC, DOCX, XLS, XLSX, HTML, TXT, PDF, PDF/A, TIFF, JPEG, JPEG2000, CSV, RTF, XML, Alto XML, EPUB.
  • Именование документов согласно заданным правилам: с использованием штрих-кода, даты и времени и т. п..
  • Публикация документов в сетевую папку и библиотеки Microsoft Office SharePoint Server.
  • Отправка документов по электронной почте.
  • Передача документов и их атрибутов в системы документооборота или хранения при помощи скрипта.

Системные требования

Поддерживаемые форматы ввода изображений:

Форматы импорта/экспорта

  • PDF: версия 1.7 и ранее
  • BMP: черно-белый, серый, цветной
  • PCX, DCX: черно-белый, серый, цветной
  • JPEG, JPEG 2000: серый, цветной
  • PNG: черно-белый, серый, цветной
  • TIFF: черно-белый, серый, цветной, многостраничный. Способы сжатия: несжатый, CCITT Group 3, CCITT Group 3 FAX (2D), CCITT Group 4, PackBits, JPEG , ZIP
  • DjVu
  • GIF
  • JBIG2
  • WDP

Форматы сохранения документов:

  • TIFF (*.tiff).
  • PDF, PDF/A
  • Microsoft Word (*.DOC, *.DOCX)
  • Microsoft Excel (*.XLS, *.XLSX)
  • Rich Text Format (*.RTF)
  • HTML
  • Plain text (*.TXT)
  • CSV
  • RTF
  • XML
  • Alto XML
  • EPUB
  • Microsoft Word XML (*.XML), XML со схемой представления данных (*.XML)
  • JPEG, JPEG 2000
  • PNG
  • внутренний формат FineReader (предназначен для интеграции с ABBYY FineReader Engine)

Функциональность

Открытый интерфейс программирования

  • Программный интерфейс, который позволяет создавать XML-описания, организовывать взаимодействие программы ABBYY Recognition Server с третьими приложениями и анализировать XML-результаты.
  • Полностью соответствует стандарту COM и может использоваться в любой COM-совместимой среде разработки, в т. ч. в  Visual Basic , C ++ и языках сценариев.

Консоль управления

  • Для работы консоли управления ABBYY Recognition Server используется Microsoft Management Console (MMC) в качестве сервиса для визуализации управления приложением MMC.

Языки распознавания

Поддержано свыше 190 языков распознавания печатного текста (OCR):

  • 43 основных языков со словарной поддержкой и проверкой правописания: армянский (восточный, западный, грабар), башкирский, болгарский, каталанский, хорватский, чешский, датский, голландский (Нидерланды и Бельгия), английский, эстонский, финский, французский, немецкий (новая и старая орфография), греческий, венгерский, индонезийский, итальянский, латышский, литовский, норвежский (нюнорск и букмол), польский, португальский (Португалия и Бразилия), румынский (латиница), русский, словацкий, словенский, испанский, шведский, татарский, турецкий и украинский.
  • 133 дополнительных языка, в которых используются латинский, кириллический или греческий алфавиты:
    абхазский, адыгейский, африкаанс, агульский, албанский, алтайский, аварский, аймара, азербайджанский (кирилица), азербайджанский (латиница), баскский, белорусский, бемба, блэкфут, бретонский, буготу, бурятский, себуанский, чаморро, чеченский, чукотский, чувашский, конго, корсиканский, крымско-татарский, кроу, дакота, даргинский, дунганский, эскимосский (кириллица), эскимосский (латиница), эвенский, эвенкийский, фарерский, фризский, фриульский, гагаузский, галисийский, ганда, немецкий (Люксембург), гуарани, хани, хауса, гавайский, исландский, ингушский, ирландский, цзинпо, кабардино-черкесский, калмыкский, карачаево-балкарский, каракалпакский, кашубский, гэлао, казахский, хакасский, хантыйский, кикуйю, киргизский, корякский, кпелле, кумыкский, курдский, лакский, латинский, лезгинский, луба, македонский, малагасийский, малайский, малинке, мальтийский, мансийский, маори, марийский, майа, мяо, минангкабау, могавк, молдавский (кириллица), монгольский, мордовский, ацтекский, ненецкий, нивхский, ногайский, ньянджа, оджибве, осетинский, папьяменто, провансальский, кечуа, ретороманский, цыганский, рунди, русский (старая орфография), руанда, саамский, самоа, гелький (Шотландия), селькупский, сербский (кириллица), сербский (латиница), шона, сомали, лужицкий, сото, сунданский, суахили, свази, табасаранский, тагальский, таити, таджикский, ток-писин, тонга, тсвана, дун, туркменский, тувинский, удмуртский, уйгурский (кириллица), уйгурский (латиница), узбекский (кириллица), узбекский (латиница), фиджи, валлийский, волоф, коса, якутский, сапотек, зулу.
  • 6 языков для распознавания европейских документов, напечатанных в XVII - XIX столетиях: английский, французский, немецкий, итальянский и испанский.
  • Арабский язык (дополнительный модуль)
  • Тайский язык (дополнительный модуль)
  • Китайский, японский, корейский языки (дополнительный модуль)
  • Иврит (дополнительный модуль)
  • 4 искусственных языка: эсперанто, интерлингва, идо, оксиденталь.
  • 6 языков программирования: Basic, C/C++, COBOL, Fortran, JAVA и Pascal.
  • Простые химические формулы.
  • Цифры.

Типы штрихкодов

  • Одномерные: Check Code 39, Check Interleaved 25, Code 128, Code 39, EAN 13, EAN 8, Interleaved 25, CODABAR (without checksum), UCC Code 128, Code 2 of 5 (Industrial, IATA, Matrix), Code 93, UPC-A, UPC-E, Patch Code and Postnet; 
  • Двухмерные: PDF 417, Aztec, Data Matrix, QR Code.

Сопроводительная техническая документация

  • Встроенная справочная система на русском, английском, немецком, французском, итальянском и испанском, китайском (упрощенный языковой пакет), португальском (бразильский языковой вариант), чешском, польском и венгерском языках содержит подробное описание всех компонентов ABBYY Recognition Server и рекомендации по настройке и работе с продуктом.
  • Руководство системного администратора содержит информацию об установке, активации лицензии и администрировании ABBYY Recognition Server.
  • Примеры кода, поставляемые вместе с ABBYY Recognition Server, демонстрируют использование открытого API для решения типовых задач.

Системные требования

Менеджер сервера

Компьютер с процессором Intel® Core™2/2 Quad /  Pentium® / Celeron® / Xeon™ , AMD K 6/ Athlon™ / Duron™ / Sempron™ или другим совместимым с ними процессором с тактовой частотой не менее 500 МГц.

  • Операционная система Microsoft® Windows 8, Windows 7, Windows Server 2012, Windows Server® 2008, Windows Server® 2008 R2, Windows Vista®, Windows Server 2003, Windows® XP, Windows 2000.
  • Оперативная память:  1 Гб.
  • Пространство на жестком диске:20 Мб для установки, плюс 1 Гб для работы программы.
  • Необходимо иметь права на чтение и запись для следующих разделов системного реестра:
    • HKEY_CLASSES_ROOT
    • HKEY_LOCAL_MACHINESoftwareABBYY
    • HKEY_CURRENT_USERSoftwareABBYY
  • Microsoft .NET Framework 2.0 или 3.5 для сохранения в Microsoft SharePoint Server.
  • Microsoft Outlook 2000 или более поздняя версия для обработки и отправки сообщений через Microsoft Exchange Server.

Станция обработки

  • Компьютер с процессором Intel® Core™2/2 Quad / Pentium® / Celeron® / Xeon™ , AMD K6/ Turion™ / Athlon™ / Duron™ / Sempron™ или другим совместимым с ними процессором с тактовой частотой не менее 2 ГГц.
  • Операционная система Microsoft Windows 8, Windows 7, Windows Server 2012, Windows Server 2008, Windows Server® 2008 R2, Windows Vista, Windows Server 2003, Windows XP.
  • Оперативная память: 512 Мб. Дополнительно 300 Мб для каждого процесса распознавания.
  • Пространство на жестком диске: 600 Мб для установки, плюс 1 Гб для работы программы.

Станция сканирования

  • Компьютер с процессором Intel® CoreTM2/2 Quad/Pentium®/Celeron®/XeonTM, AMD K6/TurionTM/AthlonTM/DuronTM/SempronTM или другим совместимым с ними процессором с тактовой частотой не менее 2 ГГц.
  • Операционная система Microsoft Windows 8, Windows 7, Windows Server 2012, Windows Server 2008, Windows Server® 2008 R2, Windows Vista, Windows Server 2003, Windows XP.
  • Оперативная память: 512 Мб минимальная, рекомендованная 1Гб.
  • Пространство на жестком диске: 1 Гб (включая 125 Мб для установки).
  • Сканнер с поддержкой интерфесов TWAIN, WIA or ISIS.
  • Видеокарта и дисплей с разрешением 1024?768.

Станция верификации

  • Компьютер с процессором Intel® Pentium® / Celeron® / Xeon™ , AMD K 6/ Athlon™ / Duron™ / Sempron™ или другим совместимым с ними процессором с тактовой частотой не менее 500 МГц.
  • Операционная система Microsoft Windows 8, Windows 7, Windows Server 2012, Windows Server 2008, Windows Server® 2008 R2, Windows Vista, Windows Server 2003, Windows XP, Windows 2000.
  • Оперативная память: 1024 Мб. При работе в многопроцессорных системах требуется дополнительно 512 Мб оперативной памяти для каждого процессора.
  • Пространство на жестком диске:  700 Мб для установки, плюс 700 Мб для работы программы.
  • Видеокарта и дисплей с разрешением не менее 1024?768.

Станция индексирования

  • Компьютер с процессором Intel® Pentium® / Celeron® / Xeon™ , AMD K 6/ Athlon™ / Duron™ / Sempron™ или другим совместимым с ними процессором с тактовой частотой не менее 500 МГц.
  • Операционная система Microsoft Windows 8, Windows 7, Windows Server 2012, Windows Server 2008, Windows Server® 2008 R2, Windows Vista, Windows Server 2003, Windows XP, Windows 2000.
  • Оперативная память: 768 Мб.
  • Пространство на жестком диске: 500 Мб для установки, плюс 1 Гб для работы программы.

Консоль удаленного администрирования

  • Компьютер с процессором Intel® Pentium® / Celeron® / Xeon™ , AMD K 6/ Athlon™ / Duron™ / Sempron™ или другим совместимым с ними процессором с тактовой частотой не менее 200 МГц.
  • Операционная система Microsoft Windows 8, Windows 7, Windows Server 2012,  Windows Vista, Windows Server 2008, Windows Server® 2008 R2, Windows Server 2003, Windows XP, Windows 2000.
  • Оперативная память: 128 Мб.
  • Пространство на жестком диске: 30 Мб.
  • Microsoft .NET Framework 2.0 или 3.5 для сохранения в Microsoft SharePoint Server.

Открытый программный интерфейс (COM- based API)

  • Компьютер с процессором Intel® Pentium® / Celeron® / Xeon™ , AMD K 6/ Athlon™ / Duron™ / Sempron™ или другим совместимым с ними процессором с тактовой частотой не менее 200 МГц.
  • Операционная система Microsoft Windows 8, Windows 7, Windows Server 2012, Windows Vista, Windows Server 2008, Windows Server® 2008 R2, Windows Server 2003, Windows XP, Windows 2000.
  • Оперативная память: 128 Мб.
  • Пространство на жестком диске: 15 Мб.

Web Service

  • Компьютер с процессором Intel® Pentium® / Celeron® / Xeon™ , AMD K 6/ Athlon™ / Duron™ / Sempron™ или другим совместимым с ними процессором с тактовой частотой не менее 200 МГц.
  • Операционная система Microsoft Windows 8, Windows 7, Windows Server 2012, Windows Vista, Windows Server 2008, Windows Server® 2008 R2, Windows Server 2003, Windows XP, Windows 2000.
  • Оперативная память: 128 Мб.
  • Пространство на жестком диске: 15 Мб и 100 Мб для работы программы.
  • Microsoft IIS 5.1 или более поздняя версия
  • Microsoft.Net Framework 2.0 или 3.5.

Наши контакты

Наш телефон: (4872) 40-59-59 (4872) 52-10-04
Наш адрес:

г. Тула, ул. Степанова, д. 34А, офис 2

Copyright © COMPANY BREVIS LLC. All Rights Reserved