ABBYY Mobile OCR Engine

ABBYY Mobile OCR Engine

 ABBYY Mobile OCR Engine, основанный на всемирно известных технологиях распознавания компании ABBYY, позволяет встраивать в мобильные устройства мощные алгоритмы обработки изображений и распознавания текста. Инструментарий сочетает в себе высокую производительность с низкой нагрузкой на ресурсы устройства.

Возможности

Высокая точность распознавания

ABBYY Mobile OCR Engine обеспечивает высокое качество оптического распознавания текста на изображениях, полученных с помощью встроенных камер мобильных устройств, портативных сканеров и цифровых фотокамер: 

 В основе ABBYY Mobile OCR Engine лежит всемирно известная технология оптического распознавания FineReader OCR, обеспечивающая высокое качество распознавания изображений на мобильных устройствах.

  •  Более высокая точность распознавания благодаря автоматическому определению переносов в тексте.
  •  Функция автоматического исправления перекосов строк. Изображения документов, полученные при помощи мобильных устройств или с использованием портативного сканера, часто имеют перекосы (изгибы) строк, что приводит к ошибкам распознавания. ABBYY Mobile OCR Engine 4.7 обнаруживает и исправляет перекосы с точностью до одного градуса, что значительно повышает качество распознавания символов.
  •  Функция определения ориентации страницы. Во время предварительной обработки изображений технология автоматически определяет ориентацию распознаваемого текста (перевернут ли текст на 90 или 180 градусов).
  •  Индикатор уверенности распознавания, который показывает, насколько уверенно распознан текст. Это позволяет разработчикам гибко задавать различные критерии при проверке орфографии и верификации данных.
  •  Алгоритм обработки изображений отбрасывает всю лишнюю информацию на изображении, что способствует более точному распознаванию текста.
  •  Проверка орфографии во время распознавания текста значительно улучшает качество получаемого результата.

Нетребовательность к аппаратным ресурсам

ABBYY Mobile OCR Engine – технология оптического распознавания с компактным программным кодом, специально оптимизированным для работы на устройствах с ограниченным объемом памяти (на мобильных телефонах и других портативных устройствах):

  •  Улучшенное управление памятью. Новый алгоритм управления памятью позволяет системе точно определять объем памяти, который необходим для обработки изображения. Благодаря этому отпадает необходимость выделять значительный объем памяти заранее, что благоприятно сказывается на скорости распознавания и стабильности работы устройства.
  •  Программный код ABBYY Mobile OCR Engine очень компактный. Программа занимает от 8 МБ ПЗУ и от 10 МБ ОЗУ (объем зависит от требуемой функциональности).

Возможность интеграции с различными мобильными платформами

ABBYY Mobile OCR Engine может использоваться в приложениях на различных платформах как для мобильных, так и для ПК: Android, iOS (iPhone), Mac OS, Windows. Возможно также портирование на иные платформы.

Распознавание визитных карточек

ABBYY Mobile OCR Engine – это больше, чем просто высокоточная технология оптического распознавания: инструментарий позволяет обрабатывать изображения визитных карточек, полученных при помощи мобильных устройств или портативных сканеров. ABBYY Mobile OCR Engine способен извлекать из изображений такую информацию, как имя и фамилия, должность, различные виды телефонных номеров, адрес электронной почты, название компании, адрес в интернете и почтовый адрес. Теперь технология обработки визиток распознает более 23 языков.

Больше языков распознавания

ABBYY Mobile OCR Engine поддерживает распознавание текстов более чем на 61 языках, что позволяет удовлетворить запросы разработчиков по всему миру:

Инновационный алгоритм анализа данных

Функция анализа данных в ABBYY Mobile OCR Engine обеспечивает высокую скорость распознавания и преобразует текст в максимально приближенном к оригиналу виде:

  • Сохранение многоколоночного текста. В предыдущих версиях ABBYY Mobile OCR Engine текст распознавался слева направо и снизу вверх, из-за чего все распознанные данные помещались в один массив. В ABBYY Mobile OCR Engine появилась функция сборки абзацев (Paragraph Assembly), которая определяет границы текстовых блоков и позволяет программе распознавать текст слева направо и снизу вверх в каждом блоке по отдельности, сохраняя многоколоночный текст, разбиение на абзацы и другое деление текста.
  • Сохранение шрифтов. ABBYY Mobile OCR Engine определяет свойства шрифтов в исходном тексте (различает полужирный шрифт, курсив и подчеркивание).

Два режима распознавания

ABBYY Mobile OCR Engine – гибкая и удобная технология, которая позволяет изменять настройки в зависимости от поставленных целей. Доступно два режима распознавания:

  • Режим экспресс-распознавания больше всего подходит для изображений хорошего качества, сокращает время на обработку изображений и распознавание текста;
  • Полный режим для максимальной точности распознавания больше всего подходит для изображений низкого качества, при этом для получения оптимального результата затрачивается больше времени.


 

Этапы ORC

Этапы Детали

Шаг 1: Импорт и обработка изображения

Изображение загружается из памяти и подготавливается для распознавания текста. Бинаризация изображения отделяет текст от фона, создавая черно-белое изображение, которое значительно меньше по размеру, чем цветной оригинал. К изображению может быть применена дополнительная коррекция перекосов строк и определение ориентации документа.

Функция автоматического исправления перекосов строк. Изображения документов, полученные при помощи мобильных устройств или с использованием портативного сканера, часто имеют перекосы (изгибы) строк, что приводит к ошибкам распознавания. ABBYY Mobile OCR Engine обнаруживает и исправляет перекосы с точностью до одного градуса, что значительно повышает качество распознавания символов.

Функция определения ориентации страницы. Во время предварительной обработки изображений технология автоматически определяет ориентацию распознаваемого текста (перевернут ли текст на 90 или 180 градусов).

Шаг 2: Анализ документа

Анализ документов представляет собой набор алгоритмов, который анализирует изображение - определяет буквы, соединения букв в словах, затем строки текста, и, наконец, параграфы. Кроме того, область чтения очищается и удаляется шум.

Поддержка переносов. Если Mobile OCR Engine встречает часть переносимого слова (например, ПОН-) на одной линии, а вторую часть (например, едельник) на следующей строке, он будет объединять их в одно слово (понедельник).

Сохранение многоколоночного текста. В предыдущих версиях ABBYY Mobile OCR Engine текст распознавался слева направо и снизу вверх, из-за чего все распознанные данные помещались в один массив. В ABBYY Mobile OCR Engine появилась функция сборки абзацев (Paragraph Assembly), которая определяет границы текстовых блоков и позволяет программе распознавать текст слева направо и снизу вверх в каждом блоке по отдельности, сохраняя многоколоночный текст, разбиение на абзацы и другое деление текста.

Сохранение шрифтов. ABBYY Mobile OCR Engine определяет свойства шрифтов в исходном тексте (различает полужирный шрифт, курсив и подчеркивание).

Индикатор уверенности распознавания, которыйпоказывает, насколько уверенно распознан текст. Это позволяет разработчикам гибко задавать различные критерии при проверке орфографии и верификации данных.

Проверка орфографии во время распознавания текста значительно улучшает качество получаемого результата.

Шаг 3: Оптическое распознавание символов (OCR)

Затем обнаруженные текстовые блоки на изображении распознаются с использованием специального языка и определённого шаблона. Для многих типов данных имеются словари разрешенных слов, которые также могут использоваться в процессе контроля данных. Результаты распознавания представляют собой набор символов с координатами, объединёнными в строки. Каждый символ имеет уровень доверия, который показывает, насколько Mobile OCR Engine был уверен в окончательном определении символа.

Два режима распознавания

ABBYY Mobile OCR Engine – гибкая и удобная технология, которая позволяет изменять настройки в зависимости от поставленных целей. Доступно два режима распознавания:

• Режим экспресс-распознавания больше всего подходит для изображений хорошего качества, сокращает время на обработку изображений и распознавание текста;

• Полный режим для максимальной точности распознавания больше всего подходит для изображений низкого качества, при этом для получения оптимального результата затрачивается больше времени.

Business Card Processing (опционально)

ABBYY Mobile OCR Engine – это больше, чем просто высокоточная технология оптического распознавания: инструментарий позволяет обрабатывать изображения визитных карточек, полученных при помощи мобильных устройств или портативных сканеров. ABBYY Mobile OCR Engine способен извлекать из изображений такую информацию, как имя и фамилия, должность, различные виды телефонных номеров, адрес электронной почты, название компании, адрес в интернете и почтовый адрес.

Теперь технология обработки визиток распознает более 23 языков.

Распознавание штрих-кодов (опционально)

Эта функция обеспечивает распознавание штрих-кодов, которая поддерживает типы 1D и 2D штрих-кодов. Поиск штрих-кода на странице, и обнаружение штрих-кода недоступны. Пользователь должен либо сфотографировать только штрих-код или вручную обрезать изображение штрих-кода.

Шаг 4: Обработка результата

Результаты распознавания могут быть обработаны и экспортированы. Разработчик приложения имеет полный контроль над OCR результатами.

 

Техническая информация

 

Поддерживаемые операционные системы

Mobile OCR Engine – кросс-платформенная технология, поддерживающая следующие ОС:

ABBYY предлагает профессиональные услуги по портированию ПО на другие платформы и по доработке ПО для конкретных задач.

Требования к памяти

ABBYY Mobile OCR Engine –  это технология с компактным кодом, занимающая минимальные ресурсы памяти:

 

  Европейские языки Корейский Китайский и японский
Библиотека (RAM), MB от 5 до 7* от 5 до 7* от 5 до 7*
Паттерны (RAM или ROM)*, MB 1.61 от 0.9 до 5.23 11.1
Кейворды (RAM or ROM)*, MB 2.1 0.048 0.357
Словари (RAM or ROM)*, MB 14.4 NA NA

 

* - требования к памяти могут варьироваться в зависимости от операционной системы и типа распознавания (например, распознавание мультиязычного текста требует больше памяти).

Сама библиотека практически всегда размещается в RAM (некоторые ОС позволяют работать прямо с карты памяти).

Паттерны, кейворды и словари размещаются в ROM, хотя некоторые ОС (редко) могут требовать их загрузку в RAM. Европейские паттерны всегда должны быть включены в сборку, другие - в зависимости от необходимого языка. Словари являются опциональным компонентом и могут быть исключены из сборки, но в этом случае качество распознавания будет ниже. Кейворды необходимы только для распознавания визитных карточек.

Поддерживаемые языки распознавания

ABBYY Mobile OCR Engine поддерживает распознавание текста на 61 языке:

  • более 20 языков со словарной поддержкой: английский, болгарский, греческий, датский, индонезийский, испанский, итальянский, немецкий, нидерландский, норвежский  (букмол и нюнорск), польский, португальский, португальский (бразильский вариант), русский, турецкий, украинский, финский, французский, чешский, шведский, эстонский.
  • 40 языков с поддержкой латинского, кириллического,  греческого, китайского, японского и корейского алфавитов без словарной поддержки: африкаанс, албанский, баскский, белорусский, бретонский, валлийский, венгерский, гавайский, идиш, ирландский, исландский, кабардинский, каталонский, китайский (традиционный) китайский (упрощенный), корейский, крымско-татарский, латинский, латышский, литовский, македонский, малайский, маори, молдавский, монгольский, осетинский, провансальский, ретороманский, румынский, самоанский, сербский, словацкий, словенский, суахили, тагальский, татарский, хорватский, фиджийский, чеченский, японский.

Распознавание визитных карточек

Модуль обработки визитных карточек позволяет распознавать карточки на 23 языках: английский, греческий, датский, индонезийский, испанский, итальянский, китайский традиционный, китайский упрощенный, корейский, немецкий, нидерландский, норвежский, португальский, португальский (бразильский вариант), русский, турецкий, украинский, финский, французский, шведский, японский, польский, эстонский.

Распознавание штрихкодов

1D 2D

Code 39

Interleaved 2 of 5     

EAN-13

Code 128

EAN-8

Codabar

UPC-E

Industrial 2 of 5

IATA 2 of 5

Matrix 2 of 5

Code 93

Postnet

UCC-128

UPC-A

 

 

 

Если вас заинтересовал данный продукт( ABBYY Mobile OCR Engine ) и вы хотите узнать о нём больше, а также о способах приобретения и возможных скидках, то вы можете оставить нам свои данные и наши менеджеры обязательно с Вами свяжутся .
   

  

Наверх