ABBYY FineReader Engine for Windows

ABBYY FineReader Engine for Windows

 ABBYY FineReader Engine 10 является первым в мире продуктом, реализующим в рамках одного SDK распознавание печатных текстов (OCR) на 198 языках на базе латиницы, кириллицы, армянского, греческого, еврейского и тайского алфавитов, японских, корейских и китайских иероглифов, а также распознавание текстов, написанных печатными буквами от руки (ICR) на 113 языках.  

Преимущества

Простой и готовый к интеграции продукт

ABBYY FineReader Engine 10 представляет собой набор компонент, которые могут быть легко внедрены в решения разработчика. Интерфейс прикладного программирования и визуальные компоненты позволяют разработчику сократить время на разработку и внедрение приложения.

Широкие возможности для создания приложений

ABBYY FineReader Engine 10 позволяет создавать многоязычные и многоплатформенные приложения любой архитектуры, начиная от рабочих станций и заканчивая серверными решениями.

Единое выгодное решение

ABBYY FineReader Engine 10 предлагает полный спектр самых современных технологий для конвертирования и архивирования документов и разработки собственных решений для потокового ввода данных. Таким образом, разработчикам не придется лицензировать разные SDK для разных задач. Это позволит им реализовать единый подход в разработке, поддержке и обучении.

ABBYY FineReader Engine 10 - инструментарий разработчика, обладающий следующими ключевыми возможностями:

Высокая точность распознавания

Технологии ABBYY получили признание во всем мире благодаря высокой точности распознавания, которая является ключевым параметром OCR-технологий. Разработчики компании ABBYY работают над улучшением этого показателя с первой версии ABBYY FineReader.

ABBYY FineReader Engine 10 распознает с высокой точностью европейские и азиатские (китайский, японский, корейский, тайский, иврит) языки.

Улучшенная скорость обработки

Скорость обработки – важный показатель качества распознавания, поэтому в ABBYY FineReader Engine 10 были добавлены способы для повышения скорости обработки:

  • Преднастроенный режим Fast mode – обработка в 2 раза быстрее, точность распознавания выше
  • Поддержка многопроцессорности   
  • Использование необходимого профиля – увеличивает общую производительность

Профили распознавания

Благодаря новому API в ABBYY FineReader Engine 10 появились преднастроенные профили с оптимальными значениями параметров распознавания для решения типовых задач распознавания: конвертация документов для сохранения в архивах или для редактирования, а также для извлечения текстов, штрихкодов или меток. Теперь, выбрав подходящий профиль, разработчик получает оптимальные настройки для решения конкретной задачи. При необходимости настройки могут быть установлены вручную.

Восстановление структуры документа (ADRT)

Технология адаптивного распознавания документов (ADRT) распознает и восстанавливает различные элементы структуры документа:

  • Восстановление логической структуры документа и форматирования
  • Восстановление структуры и содержимого таблиц
  • Распознавание вертикального текста
  • Распознавание страниц с большими картинками и фрагментами текста

Преобразование PDF-файлов

  • Профили для экспорта в формат PDF
  • Технология сжатия Mixed Raster Content (MRC)
  • Поддержка PDF/A

Улучшенная обработка фотографий документов (Camera OCR)

Последнее время для оцифровки документов часто используются встроенные камеры. Для получения хорошего качества распознавания такого изображения требуется специальная предобработка, которую можно осуществить с помощью функций, встроенных в ABBYY FineReader Engine 10:

  • Корректировка разрешения изображения
  • Устранение перекосов
  • Автоматическое исправление 3D искажений (в виде пирамиды)
  • Исправление размытых изображений
  • Уменьшение ISO шума

ABBYY FineReader Engine 10 имеет революционные улучшения:

  • Увеличение скорости обработки до 44% для русского языка.
  • Увеличение скорости обработки до 92% для основных европейских языков.
  • Увеличение точности распознавания до 40% для китайского, японского и корейского языков.
  • Оптимально сбалансированные профили с настроенными параметрами для ваших практических задач.
  • Абсолютный мировой рекорд: 198 языков распознавания, включая китайский, японский, корейский, вьетнамский, тайский и иврит.
  • Обновленное «Руководство разработчика» («Справка») стало еще подробнее и удобнее в использовании.

 

Возможности

 

Операции с изображением, предварительная обработка изображения

ABBYY FineReader Engine 10 поддерживает основные графические форматы, включая многостраничные TIFF и JPEG 2000, и работает с черно-белыми, серыми и цветными изображениями. Изображения могут поступать на обработку в ABBYY FineReader Engine 10 несколькими способами: со сканера через TWAIN-интерфейс, непосредственно из памяти или из файлов. Программа также может открывать PDF-файлы и преобразовывать их в изображения с помощью Adobe PDF Library. В ABBYY FineReader Engine есть возможность управлять такими параметрами сканирования как яркость, цветность, разрешение, область сканирования, одно- или двустороннее сканирование. Можно также задать паузу между сканированием страниц и т.д.

озможности распознавания ABBYY FineReader Engine 10:

  • распознавание печатных текстов на 198 языках
  • распознавание рукописных символов  на 113 языках
  • распознавание различных видов штрихкодов
  • распознавание меток (OMR) 
  • преобразование PDF-файлов 
  • получение и экспорт распознанного текста

Создание пользовательского интерфейса

ABBYY FineReader Engine 10 содержит готовые инструменты для создания пользовательского интерфейса. Используя специальные визуальные компоненты, можно быстро и легко встроить в конечное приложение удобный интерфейс для обработки отсканированных изображений, редактирования и корректировки результатов распознавания.

 

Что нового

 

Улучшенная скорость распознавания

Отлаженный режим Fast mode показывает отличный результат – для русского языка скорость распознавания улучшена на 44%, для популярных европейских языков – на 100%* с точностью более чем 98,5%. Вы получаете уникальное сочетание скорости и точности распознавания.
*по сравнению с режимом Fast mode для ABBYY FineReader Engine 9.0 (1 release, 21 October 2008)

Замечание: Поддержка многопроцессорности обеспечивает близкую к линейной зависимость скорости обработки от количества ядер для многостраничных документов. Для двухъядерного процессора обработка происходит почти в 2 раза быстрее, для четырехъядерного – почти в 4 раза!

Улучшенная точность распознавания

  • Улучшенный классификатор для CJK. Благодаря улучшенному классификатору азиатских символов точность распознавания китайского, японского и корейского языков улучшена на 30-50%. ABBYY OCR SDK обеспечивает высокий уровень точности распознавания среди международных многоязычных OCR-технологий и поддерживает 198 языков распознавания.
  • Новый режим распознавания для изображений низкого разрешения. Специальный режим распознавания для документов с низким разрешением, например, полученных с факсов, позволяет улучшить качество распознавания на 20%* по сравнению с режимом Normal mode. Теперь распознавание документов низкого качества не сопровождается большим количеством ошибок.

по сравнению с режимом Normal mode для ABBYY FineReader Engine 9.0 (1 release, 21 October 2008). 

Уникальные возможности для восстановления оригинального расположения элементов документа и его структуры

Новые возможности ABBYY FineReader Engine 10 позволяют восстанавливать оригинальное расположение элементов документа и его структуру для повторного использования документов:

  • Распознавание структуры документа. ABBYY FineReader Engine 10 автоматически выделяет заголовки в распознаваемом документе, определяет их уровень в структуре документа, стиль текста и восстанавливает всю структуру финального документа в виде Document Map.
  • Восстановление оглавления. В полученном документе оглавление выглядит как набор ссылок к заголовкам. После внесения изменений в документ оглавление обновляется автоматически (при добавлении новых заголовков они автоматически появляются в оглавлении, номера страниц при этом также обновляются).
  • Распознавание схем и диаграмм. Возможность автоматического определения схем и диаграмм улучшена в 10-й версии ABBYY OCR SDK. Сейчас можно выбирать, распознавать ли текст на схеме или оставить изображение в исходном виде. 
  • Обработка картинок и заголовков таблиц. ABBYY FineReader Engine 10 автоматически выделяет заголовки картинок и таблиц и экспортирует их в финальный документ как простой фрейм, включая картинку и ее заголовок.
  • Определение стиля документа. ABBYY FineReader Engine 10 анализирует тип и размер шрифта, его расположение и ошибки соответственного стиля шрифта для каждого типа текста. Таким образом, для заголовков каждого уровня существуют специальные стили, для обычного текста, оглавления и для заголовков картинок также существуют специальные стили.
  • Модель «глянцевый журнал». Новый ABBYY SDK восстанавливает изображения с большим количеством картинок и текстовых блоков на странице, включая очень большие картинки размером в страницу.

Улучшенный экспорт в формат PDF

  • Превосходное соотношение качества и размера для PDF-файлов. Новый экспорт в PDF вместе с MRC-сжатием (Mixed Raster Content) позволяет достигнуть более высокого качества и меньшего размера PDF-документов. Вы получаете превосходное соотношение качества и размера для PDF-файлов как с MRC, так и без него.
  • Профили для экспорта в формат PDF. Можно настроить более чем 40 параметров для экспорта в PDF. ABBYY FineReader Engine 10 обеспечивает предопределенные профили с оптимальными значениями для популярных вариантов экспорта:
    • Режим наилучшего качества
    • Сбалансированный режим
    • Режим максимальной скорости
    • Режим с минимальным размером файла 
      С предопределенными профилями для экспорта в PDF можно автоматически установить оптимальные значения для каждой задачи.

Улучшенное API

  • Специальные профили для популярных сценариев. Многие разработчики утверждают, что ABBYY FineReader Engine API – самый мощный и полнофункциональный среди OCR SDKs. При этом он прост в использовании благодаря новым профилям с оптимальными значениями параметров распознавания для решения типовых задач. При необходимости можно устанавливать настройки вручную.
    Теперь не нужно тратить время на изучение большого количества возможностей и параметров SDK API. Достаточно выбрать профиль, и ABBYY FineReader Engine 10 установит оптимальные значения для максимальной эффективности распознавания. Таким образом, разработчик может легко и быстро интегрировать OCR-технологии ABBYY в свое приложение и достигнуть превосходного результата распознавания.
  • Структура документа (через API). ABBYY FineReader Engine 10 обеспечивает уникальный набор возможностей для доступа к элементам структуры документа, таким как заголовки, разделы документа, номера страниц, сноски и др. Сейчас функции API позволяют точно и аккуратно внести изменение в документ, сохраняя при этом его оригинальную структуру.  

Улучшенное качество обработки изображений документов и фотографий

  • Camera OCR. Camera OCR – набор инструментов для обработки фотографий документов для повышения качества их последующего распознавания – имеет новые уникальные возможности:
    • Автоматическое исправление 3D-искажений (в виде пирамиды)
    • Исправление размытых изображений
    • Уменьшение ISO-шума

Большинство изображений, полученных с помощью встроенных камер, часто имеют различные дефекты. С новой возможностью Camera OCR ABBYY FineReader Engine 10 можно исправить дефекты и получить качественные результаты распознавания.

 

Сценарии

 

Системы электронного документооборота 

Сценарии

 

Благодаря использованию ABBYY FineReader Engine компании-разработчики систем электронного документооборота могут использовать в своих продуктах самые современные технологии распознавания документов. Пользователи систем получат возможность переводить все поступающие бумажные документы в привычные электронные редактируемые форматы или PDF-формат. Использование технологий ABBYY FineReader Engine 10 повысит удобство работы с документами в системе, а наличие готовых визуальных компонент для создания пользовательского интерфейса сократит трудозатраты на внедрение.

Электронные архивы документов

Сценарии

Важным фактором при создании архивов является скорость и простота ввода документов, а также удобный формат хранения и возможность поиска по содержимому. При помощи ABBYY FineReader Engine 10 можно легко перевести бумажный архив в удобный электронный формат с возможностью организации поиска. Для экспорта данных может быть использован формат хранения PDF/A со сжатием, что значительно сэкономит место в архиве для хранения документов.

 

Приложения по распознаванию текста на цифровых фотографиях

Сценарии

Функционал ABBYY FineReader Engine может быть применен для обработки как отсканированных изображений, так и изображений, полученных с цифровой фото- или видеокамеры. ABBYY FineReader Engine 10 включает технологию нового поколения для обработки снимков и выполняет все необходимые операции по обработке и улучшению качества изображения (выравнивание, очистка, т.п.). Возможность обработки текстов на снимках, полученных с цифровых камер, дает разработчику ряд новых возможностей, как, например, распознавание текстов с постеров, книг, журналов и других изображений, которые нельзя отсканировать.

Системы контроля утечек информации

Сценарии

При создании систем контроля утечек информации в рамках предприятия важно контролировать движение информации в любых форматах. При копировании электронных документов на внешний носитель, диск или дискету, а также при отправке документа по почте или на печать специальные перехватчики в системе контроля проверят этот документ на наличие секретной информации. Для отслеживания утечки информации в документах в формате PDF, JPEG, TIFF и т.д., а также для предотвращения утечки сделанных пользователем снимков экрана (screenshots) необходимо предварительное полнотекстовое распознавание, что может быть легко реализовано с помощью ABBYY FineReader Engine.

Новые сферы использования

Сценарии

Помимо стандартных сценариев работы с документами, функциональность ABBYY FineReader Engine 10 может быть использована и в других сферах: например, при видеоклипинге, мониторинге прессы, в контрольно-пропускных системах, а также во многих других сферах, где требуется распознавания текста с отсканированных или сфотографированных изображений.

Профили

Благодаря новому API в ABBYY FineReader Engine 10 появились преднастроенные профили с оптимальными значениями параметров распознавания для решения типовых задач распознавания: конвертация документов для сохранения в архивах или для редактирования, а также для извлечения текстов, штрих кодов или меток. Теперь, выбрав подходящий профиль, разработчик получает оптимальные настройки для решения конкретной задачи. При необходимости настройки могут быть установлены вручную. 

 

Техничесие требования

 

Поддерживаемые среды разработки

ABBYY FineReader Engine 10 для Windows поддерживает различные языки программирования и платформы:

  • Microsoft Visual Studio.NET (VB.NET, C#);
  • Microsoft Visual Basic 5.0, 6.0;
  • Microsoft Visual C++ 4.x и выше;
  • VB Script и другие скриптовые языки;
  • Borland Delphi 2.0 и выше;
  • Java.
  • А также любые другие среды разработки с корректной поддержкой COM и ActiveX.

К ABBYY FineReader Engine 10 для Windows прилагаются образцы кода для Visual Basic, Visual Basic .Net, Delphi, C++, C++ с поддержкой COM, C# и для скриптовых языков.

Требования к рабочей станции

  • ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).
  • Операционная система: Microsoft Windows 7 (32/64bit), Windows Server 2008 (32/64bit), Windows Vista (32/64bit), Windows Server 2003 (32/64bit), Windows XP (32/64bit), Windows 2000.
  • Память:
    • для обработки одностраничных документов: минимум 400 МБ в ОЗУ, рекомендуется 1 ГБ;
    • для обработки многостраничных документов: минимум 1 ГБ в ОЗУ, рекомендуется 1,5 ГБ.
  • Место на жестком диске: 800 МБ для установки библиотек и 100 МБ для работы программы, а также дополнительно 15 МБ для каждой обрабатываемой страницы многостраничного документа.
  • Полностью TWAIN-совместимый сканер, цифровая фотокамера или факс-модем – только для функции сканирования.
  • Видеокарта и монитор с минимальным разрешением 1024x768 — для обучения шаблонов, редактирования словарей и сканирования при помощи графического пользовательского интерфейса).
  • Клавиатура, мышь или иное устройство ввода.
  • На рабочей станции должны быть доступны следующие разделы реестра:
    • "HKEY_CURRENT_USER\Software\ABBYY\SDK\10\FineReader Engine" — полный доступ;
    • "HKEY_CURRENT_USER\Software\ABBYY\SDK\10" — полный доступ только для установки;
    • "HKEY_LOCAL_MACHINE\Software\ABBYY\SDK\10" — полный доступ только для установки.
  • На рабочей станции должны быть доступны следующие директории:
    • папка с бинарными файлами ABBYY FineReader Engine 10 для Windows — чтение;
    • папка %TEMP% — полный доступ;
    • %ALLUSERSPROFILE%\Application Data\ABBYY\SDK\10\Licenses — полный доступ;
    • %ALLUSERSPROFILE%\Application Data\ABBYY\SDK\10\FineReader Engine — полный доступ.
  • Должны быть установлены следующие компоненты:
    • Microsoft Internet Explorer 5.0 или выше;
    • Windows Common Controls версии 5.80 или более поздней и Rich Edit Control версии 3.0 или более поздней, если в вашем приложении используется обучение шаблонов, редактирование словарей или сканирование при помощи графического пользовательского интерфейса.

Требования к серверу

  • ПК с x86-совместимым процессором (с тактовой частотой 1 ГГц и выше).
  • Операционная система: Microsoft Windows 7 (32/64bit), Windows Server 2008 (32/64bit), Windows Vista (32/64bit), Windows Server 2003 (32/64bit), Windows XP (32/64bit), Windows 2000.
  • 25 МБ свободного места на жестком диске.
  • Полный доступ к папке %ALLUSERSPROFILE%\Application Data\ABBYY\SDK\10\Licenses.

Форматы импорта

  • PDF: файлы формата PDF (версия 1.7 или более ранние)
  • BMP: чёрно-белый, серый, цветной
  • PCX, DCX: чёрно-белый, серый, цветной
  • JPEG: серый, цветной
  • JPEG 2000, part1: серый, цветной
  • PNG: чёрно-белый, серый, цветной
  • TIFF: чёрно-белый, серый, цветной, многостраничный. Способы сжатия: несжатый, CCITT Group 3, CCITT Group 3 FAX (2D), CCITT Group 4, PackBits, JPEG, ZIP
  • GIF: чёрно-белый, серый, цветной
  • DjVu: чёрно-белый, серый, цветной
  • JBIG2: черно-белый
  • WDP: чёрно-белый, серый, цветной

Форматы экспорта

  • Microsoft Word (.DOC)
  • Rich Text Format (.RTF)
  • Microsoft Word XML (.XML) (только для Microsoft Office Word 2003)
  • Microsoft PowerPoint (.PPT)
  • Microsoft Excel (.XLS)
  • XML-форматы Microsift Office 2007 (.DOCX, .XLSX, .PPTX)
  • PDF, PDF/A (включая компрессию)
  • Обычный текст (.TXT). ABBYY FineReader Engine 10 для Windows поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодовые страницы Unicode (UTF-16, UTF-8).
  • HTML. ABBYY FineReader Engine 10 для Windows поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO) и кодовые страницы Unicode (UTF-8)
  • Формат с разделением запятыми (.CSV)
  • DBF. ABBYY FineReader Engine 10 для Windows поддерживает различные кодовые страницы (Windows, DOS, Mac, ISO)

Языки распознавания

ABBYY предлагает высокоточные технологии оптического распознавания печатных символов (OCR), распознавания рукопечатных символов (ICR), распознавания меток (OMR) и чтения штрих-кодов для самого широкого набора языков: 198 языков для OCR и 113 языков для ICR. Кроме того, API-интерфейс ABBYY FineReader Engine 10 для Windows содержит специальные инструменты для обучения шаблонов и создания пользовательских языков.

Распознавание штрихкодов

  • Одномерные: Check Code 39, Check Interleaved 25, Code 128, Code 39, EAN 13, EAN 13 Supplemental, EAN 8, Interleaved 25, CODABAR (без контрольной суммы), UCC Code 128, Code 2 of 5 (Industrial, IATA, Matrix), Code 93, UPC-A, UPC-E, Postnet, Patch.
  • Двумерные: PDF 417, Aztec, Data Matrix, QR Code

Дополнительные модули

Для ABBYY FineReader Engine 10 для Windows имеется несколько дополнительных модулей (доступны по лицензиям типа Run-Time) расширяющих его функциональность: специальный анализ документов для счетов, дополнительные возможности по распознаванию PDF-документов, оптическое распознавания китайских, японских и корейских символов, оптическое распознавание тайских текстов, оптическое распознавание текстов на иврите и другие.

Языки сообщений

Заголовки и тексты диалогов, сообщения об ошибках и другие сообщения программы могут выводиться на английском, немецком, итальянском, французском, испанском, нидерландском, португальском, русском, эстонском, польском, чешском, словацком, венгерском, болгарском, украинском, шведском, греческом, литовском и латышском языках.

Сопроводительная техническая документация

  • «Руководство разработчика» в форматах CHM и PDF на английском языке содержит подробную информацию об интерфейсе программирования (API) и общую информацию о лицензировании и активации.
  • Образцы кода, поставляемые вместе с ABBYY FineReader Engine 10 для Windows, помогут разработчику научиться использовать API-интерфейс для типичных случаев. Разработчики могут копировать, изменять или использовать образцы кода для создания собственных программ на основе FineReader Engine API.
  • «Руководство администратора» содержит сведения об установке FineReader Engine в локальной сети и об управлении лицензиями при помощи утилиты Network License Manager.

 

 

 

 

Если вас заинтересовал данный продукт( ABBYY FineReader Engine for Windows ) и вы хотите узнать о нём больше, а также о способах приобретения и возможных скидках, то вы можете оставить нам свои данные и наши менеджеры обязательно с Вами свяжутся .
   

  

Наверх