Компания Abbyy сообщила о выходе FineReader Engine 9.0 for Linux, новой версии инструментария разработчика (SDK), предназначенного для встраивания функций оптического распознавания в приложения независимых производителей. SDK сочетает в себе инструменты для распознавания, улучшенную поддержку азиатских языков (CJK), технологию ADRT для качественного восстановления внешнего вида и структуры документа, а также поддержку MRC-сжатия для форматов PDF и PDF/A.
«В настоящее время Linux становится всё популярнее в России. Особый интерес к нему проявляют крупные компании и государственные структуры: открытый программный код Linux обеспечивает прозрачность работы этой платформы, она более предсказуема и, что очень важно, её легче контролировать, – отмечает Андрей Исаев, директор департамента продуктов для разработчиков. – Системы, которые используются в подобных организациях, требуют исключительного качества и стабильности встраиваемых технологий».
ABBYY FineReader Engine 9.0 for Linux избавит разработчиков от дополнительных расходов и скрытых издержек, которые сопровождают использование технологий Open Source. Производителям больше не придётся сталкиваться с отсутствием обстоятельной документации, несистематичными обновлениями и низким качеством распознавания, которое может вызвать недовольство со стороны пользователей.
В отличие от Open Source OCR-решений, инструментарий Abbyy сопровождается подробной документацией, имеет техническую поддержку (в том числе на русском языке) и постоянно обновляется.
Новая версия инструментария поддерживает 198 языков распознавания, включая языки на базе кириллического и латинского алфавитов (в том числе европейские готические шрифты), а также такие сложные для распознавания языки, как корейский, японский, китайский, вьетнамский, тайский и иврит. Кроме того, SDK распознаёт многоязычные документы, причём в одном и том же документе могут быть использованы языки различных видов письменности (например, китайский и немецкий, иврит и французский).
Запатентованная технология ADRT позволяет обрабатывать документ как единое целое. Используя специальный алгоритм, система распознаёт такие элементы структуры, как колонтитулы, сноски, нумерация страниц и подписи. В результате использования этой технологии многостраничные документы обрабатываются более эффективно – повышается качество и скорость обработки данных, минимизируется время на сборку отдельных страниц в единый документ.
Решение распознает более 15 видов одномерных и двумерных штрихкодов (включая PDF 417, Aztec, DataMatrix и QR Code) независимо от их положения на странице и ориентации.
SDK предоставляет возможности для работы с PDF, таких как создание PDF-файлов с возможностью поиска и применением тегов, извлечение метаданных, сохранение гиперссылок и внутренних ссылок документа, поддержка различных средств безопасности. Продукт предлагает технологию MRC-сжатия (Mixed Raster Content) для форматов PDF и PDF/A, в результате которого визуальные характеристики файла не страдают.
Источник: CyberSecurity
|