В Яндекс.Диск стало доступно распознавание текста с изображения

Введите ваш email:    

текст с изображенияКомпания Яндекс разместила в своем блоге информацию, что ее облачный сервис (Яндекс.Диск) освоил распознавание текста с изображения. Теперь внутри сервиса можно осуществлять поиск текста, находящегося на изображениях таких форматов, как JPEG, PNG и GIF.

Основой данного поиска стала технология, способная распознавать текст с помощью оптических методов. В результате была разработана система, включающая в себя два модуля: классификатор и распознаватель. Первый, то есть классификатор, предназначен лишь для того, чтобы находить изображения, которые включают в себя текст. После этого задействуется второй модуль, работающий достаточно интересно.

В частности, так называемый распознаватель определяет линии на изображении, которые, по его мнению, являются частью текста. Затем с помощью этих линий создаются символы, приблизительно напоминающие ту или иную букву. Наконец, вступает в действие алгоритм, решающий какое из распознаваний в большей мере соответствует известным ему буквам. На последнем этапе задействуется языковая модель, использующая разнообразные словари, для определения слов, составляющих текст на изображении.


Эффективность вышеприведенной методики достаточно высокая. Например, отсканированные документы позволяются считывать правильно с них текст в 80% случаях. Если же это фотография, то среднее значение правильного распознавания составляет 63,2%. Максимального результата удается добиться при работе со скриншотами – 100%.

распознавание текста с изображения

•••

Читать:  Сервис облачного хранения от Mail.ru

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *

один + три =

^наверх