Разработка оптического распознавания символов (OCR)

История распознавания текста

Всего два десятилетия назад перед специалистами по сбору данных стоял вопрос: как собирать данные с бумажных носителей для автоматической обработки?

Двадцать лет назад EasyData уже считалась лидером в своей сфере. Мы начали наше путешествие по OCR в 1999 году с TextBridge, который очень скоро был заменен на ABBYY FineReader, лучшую систему распознавания текста того периода. 

EasyData, с самого начала своего основания, активно сотрудничает с компанией ABBYY, выступая дистрибьютором их программных продуктов, а также оказывая техническую поддержку пользователей. 

Мы будем рады предложить Вам все виды технологий ABBYY.

Разработка OCR

Совсем недавно многие производители вкладывали большие объемы времени и средств, чтобы добиться наилучших результатов в  преобразовании текста в удобный цифровой формат с последующим распознаванием текста.

Сегодня на рынке представлено большое количество технологий оптического распознавания. Имеется даже движок OCR с открытым исходным кодом и довольно приемлемыми результатами.

Мы много раз задавались вопросом: как добиться сбалансированного соотношения цены и качества для наших проектов? После многих лет разработки и реализации проектов EasyData нашли идеальное  решение и представляют Вашему вниманию альтернативную технологию OCR.

Опыт в OCR

Знания и опыт в OCR используются вот уже два десятилетия для различных решений оптического распознавания. От газет, которым требуется 99-процентная точность, до считывания счетов, где нужна 100-процентная точность распознавания. Основываясь на интеллектуальных бизнес-инструментах, мы можем реализовать большинство пожеланий наших клиентов в области OCR. Но мы не останавливаемся на достигнутом. Наша цель – преобразование инновационных технологий в обычные службы, которыми может пользоваться каждый. Отсканированная рекламная брошюра ниже показывает результаты EasyData OCR по сравнению с другим механизмом оптического распознавания.

EasyData OCR

Horse vs. Automobile
BEFORE you discard your horse ahd buy an autoit is well to think of the cost.
Figure how much you spend for harness and then think of what new tires amount to.
Figure up what it takes to feed-Dobbin in a year and then think of gasoline, repairs and storage charges.
Dobbin is worth what you paid for him two years ago, where’s the man with an auto that can say the same? Come in and get a new harness instead of a new car and remember that Dobbin will take you through snow and mud as well as on good roads and that his carburetor i is never out of order.

Ed. Klein
732 Massachusetts Street

Другой OCR

Horse vs. Automobile
BEFORE you oil card your horse arid buy an auto it » well to think of the cos*. 1
Figure how much you spend for hat nets and then think of what new tires amount to.
Figure up what it takes to feed-Dobbin in a year and then think of gasoline, repairs and storage charges.
Dobbin is worth what you paid for him two years ago, where’s the man with an auto that can say the same? Come in and get a new harness instead of a new car and remember that Dobbin will take you through snow and mud as well as on good roads and that his carburetor i is never out of order.

Ed. Klein
732 Massachusetts Street

Качество оптического распознавания текста можно повысить с помощью интеллектуальных алгоритмов улучшения изображения, предоставляемых EasyData. С помощью нашего облачного решения OCR, Вы можете использовать различные конфигурации. Наши специалисты по оптическому распознаванию текста помогут Вам грамотно начать Ваш проект OCR и будут контролировать качество распознавания текста на протяжении всего проекта.

Наша разработка OCR

Не секрет, что преобразование миллионов документов в сторонние коммерческие продукты – чрезвычайно  затратный процесс.

Наша задача заключалась в создании механизма распознавания текста высокого качества и быстрого по скорости. И мы это сделали. Наша станция обработки легко обрабатывает 5 миллионов страниц из файла изображения в распознанный документ формата PDF/A в течение 24 часов.

Эта скорость интересна не только с позиции обработки документов. Обработка больших объемов за короткое время дает пользователю или аналитику наилучшие фундаментальные возможности для машинного обучения и анализа данных. Мы также можем подключить алгоритмы машинного обучения к результатам OCR для извлечения данных. 

Расскажите нам о Вашем проекте, и мы подберем Вам наиболее оптимальный вариант.

OCR и не только

EasyData OCR – интеллектуальная, быстрая и недорогая технология с хорошим качеством распознавания. Сегодняшние технологии OCR используются не просто в области распознавания текста, они напрямую связаны с анализом данных и машинным обучением. Мир технологии OCR кардинально изменился.

В рамках работы над проектами наших клиентов, EasyData обрабатывает онлайн миллионы документов, извлекая из них заданные проектом данные. Следующий логический шаг – анализ данных на основе извлеченного контента. По этой причине мы пользуемся OCR при обработке изображений. 

Сегодня документы все чаще создаются сразу в цифровом виде, что исключает необходимость использования какой-либо технологии OCR. Именно для таких документов мы создали PDFCommunicator. Идеальное решение для умного офиса!

Знакомьтесь, ICR

Наши специалисты по технологиям оптического распознавания символов время от времени получают запросы на распознавание рукописного текста. «ICR» означает «интеллектуальное распознавание символов», что подразумевает другой подход к распознаванию – рукописный текст всегда уникален и не может быть кэширован по типу и размеру шрифта.

С помощью машинного обучения мы смогли получить отличные результаты. EasyData может распознавать рукописные символы в документах и автоматически делать их доступными для цифровой интерпретации.

Облачное решение OCR

За оптическим распознаванием текста через Интернет – будущее. Ведь в таком случае нет необходимости настраивать дорогое оборудование. Это безопасное и масштабируемое решение, которое прикрепляется к Microsoft Azure, NextCloud или любой другой платформе, которую вы предпочитаете использовать. Сервис EasyData OCR можно рассматривать как наиболее гибкое и эффективное решение OCR SaaS на рынке.

Мы предлагаем пользователям стабильное облачное решение OCR вплоть до моделей машинного обучения. Передовая технология OCR у Вашего порога.