Телефон как сканер: распознаем снимки программой ABBYY FineReader 10

Сергей Моцар, ТехноПортал • 23874 просмотра Комментариев 1 Комментариев 1




Современные технологии открывают все новые области применения мобильных телефонов. Ныне телефоны могут использовать в качестве пульта дистанционного управления, для контроля здоровья и разработки программ тренировок, как карманный телевизор и т.д. Еще одну возможность нестандартного применения мобильного телефона открывает использование программы ABBYY FineReader.

Напомним, что FineReader — популярное приложение для распознавания текстов. Как правило, пользователи предпочитают использовать для распознавания отсканированные документы, но ситуация может сложиться так, что сканера под рукой нет. В таком случае десятая версия FineReader допускает использование фотографий документов, даже если они сфотографированы камерой мобильного телефона. С этой возможностью программы мы и ознакомимся.

Для распознавания снимков документов мы использовали ABBYY FineReader 10 Professional Edition. Кстати, эту программу можно бесплатно скачать для тестирования с сайта разработчика. Такая версия действует 15 дней и позволяет распознать 50 документов. Также программу можно купить, однако будьте готовы расстаться с суммой 500-800 грн. (в зависимости от версии).

Стартовая страничка программы ABBYY FineReader 10 Professional Edition.

Фотографирование с помощью Nokia E51

Для первого теста использовался мобильный телефон Nokia E51 — типичный бизнес-смартфон, не самая новая модель оснащенная всего-навсего 2-мегапиксельной камерой. Документ представлял собой лист формата A4 с текстом и картинкой. Камера телефона была выставлена на максимальное разрешение. Документ поместили на подоконник и сфотографировали при естественном освещении (пагода была пасмурная). Получившаяся фотография, откровенно говоря, восторга не вызвала — довольно-таки мутный текст, слегка расплывшиеся буквы, перекошенный лист бумаги.



Это часть фотографии документа в натуральную величину. Как видим, текст разборчивый но качество его не идеально.

Тогда мы запустили FineReader, открыли в нем фотоизображение и без всякой дополнительно обработки нажали кнопку «Распознать». Процесс распознавания не занял много времени. Получившийся документ был сохранен в Word, результаты процесса вы можете видеть на скриншотах.

Завершение процесса распознания страницы программой ABBYY FineReader 10.

Распознанный текст в редакторе Word.

После обработки документа программа FineReader выдала совет использовать снимок более высокого разрешения для корректного распознавания более мелкого шрифта. Действительно, блоки текста помельче (отмечены на скриншоте красным) программа распознала, мягко говоря, не очень хорошо. Но следует участь, что эти текстовые блоки не были набраны, а представляли собой слайд, который распечатался в заметно худшем качестве, чем набранные вручную строки. Прочий текст, вопреки сомнениям, был распознан вполне удовлетворительно. Да, и конечно же, не распознавались слова, написанные латиницей.

Тот же фотоснимок документа мы попробовали подвергнуть процедуре распознания после дополнительной обработки, предусмотренной в FineReader. Для этого там имеются такие функции, как исправление трапециевидных искажений, уменьшение шумов, устранение размытия, а также исправление искажения строк. Никакого особого улучшения качества распознания мы не увидели.

Процесс редактирования документа в программе ABBYY FineReader 10 Professional Edition.

На втором этапе тестирования документ фотографировался той же фотокамерой в максимальном разрешении, но при искусственном освещении. Качество снимков при этом заметно ухудшилось, отдельные слова просто сливались в нечто неудобочитаемое. Естественно, все это сказалось на итоге распознавания текста — корректно распознаны были только отдельные слова. Ничуть не помогла и предварительная обработка изображения средствами FineReader.

Фотография документа, полученная при искусственном освещении.

Результат распознавания документа, сфотографированного при искусственном освещении.

Наконец, не надеясь на положительный результат, но чтобы расставить все точки над «i» на третьем этапе документ был сфотографирован все той же камерой при дневном освещении, но с установленным на ней VGA-разрешением, что соответствует 0,3 Мп. Как и ожидалось, попытка эта привела к полному фиаско — текст вообще не был распознан (если не считать «шапки», набранный очень крупным шрифтом).

Документ, сфотографированный в VGA-разрешении.

Фотографирование с помощью Nokia 7390

Продолжая тестирование, мы фотографировали документ женским слайдером Nokia 7390 — не в силу пристрастия к телефонам финского производителя, просто это был первый подвернувшийся под руку аппарат с 3-мегапиксельной камерой. Использование камеры с более высоким разрешением сразу положительно сказалось на качестве распознавания текста.

Для начала документ был сфотографирован при дневном освещении. Снимок получился не в пример более четким, чем при использовании 2-мегапиксельной камеры. Почти все слова в документе, включая мелкий и плоховато пропечатанный шрифт слайда, были корректно распознаны приложением без всякой предварительной обработки изображения.

Некоторые сложности вызвала конвертация полученного текста в документ Word. Программа бесхитростно подстроила вордовскую страничку под размеры фотографии, поэтому размеры полученного в результате документа заметно превышали формат A4. Но эта проблема была легко устранена путем изменения соответствующих настроек в FineReader — текст по умолчанию конвертировался в формат А4.

Процесс изменения настроек в ABBYY FineReader 10 Professional Edition.

Второй опыт был произведен с изображением документа, снятого все той же камерой, но при искусственном освещении. На этот раз программа хуже распознала мелкий шрифт, но с основным текстом справилась хорошо. На этом тестирование было прекращено.

Выводы

Итак, мы провели распознавание текста документов, сфотографированных самыми распространенными на сегодня телефонными камерами — 2-х и 3-мегапиксельной. Для 2-мегапиксельной камеры удовлетворительных результатов удалось добиться, когда документ был сфотографирован при естественном освещении. Довольно тусклое искусственное освещение заметно ухудшило результат. Зато 3-мегапикскельная камера хорошо сработала — в обоих случаях распознавание текста было корректным. Так что использование современных камерафонов для таких целей гарантированно приведет к хорошему результату. Подводя итоги, отметим, что опыт использования камеры телефона в качестве сканера вместе с ABBYY FineReader 10 Professional Edition оказался успешным.


Ключевые слова: Мобильные телефоны, программное обеспечение, ABBYY, ABBYY FineReader


Отзывы (1)

Каплан (сын) (Гость) | 4 декабря 2011 в 11:22

Идея не новая, обкатанная. Материал плохой. Если руки не трясутся и фотографировать без "рывка" пальцем - 2-х мегапиксельные камеры справляются. А если фотографировать не весь А4, а по пол-листа (2хА5) - вообще влёт!

Ответить


Сайт принадлежит компании ООО “Креатив Медиа” © 2007–2016
Карта сайта

ТехноПортал ВКонтакте ТехноПортал на Facebook ТехноПортал на Google+ ТехноПортал на YouTube