GetInfo.Ru – Компьютерная библиотека
Последние поступления
Как выбрать систему управления базы данных
Базы данных03/09/14
Этапы загрузки UNIX (в схеме)
Unix27/03/12
Gatewall Antispam: тотальный контроль электронной почты
Спам21/04/11
Мастер-класс: создаем Интернет-магазин (Часть 1)
Обзоры ПО20/04/11
CorelDRAW Graphics Suite X5: Что нового?
Обзоры ПО20/07/10
Добавить статью
Самые читаемые материалы
Open Office - Открытая альтернатива(30310)
Программное обеспечение: легальное и... бесплатное!(27332)
Весь мир в оффлайн(22467)
Программа для ТВ-программы(20170)
Microsoft Office 2003 - предварительный обзор(20110)
ABBYY FineReader 12 Professional распознавание текста.
Всего статей: 793Всего авторов: 364Подразделов: 47Добавлено за сутки: 0
Статьи  СТАТЬИ Форум  ФОРУМ Рейтинг  РЕЙТИНГ Поиск  ПОИСК Контакты  КОНТАКТЫ
» Главная » Обзоры ПО » ABBYY FineReader 10 Professional Edition - как распознать документы?

ABBYY FineReader 10 Professional Edition - как распознать документы?


Романенко Людмила
http://www.1csoft.ru

Программа ABBYY Finereader наиболее известный и распространенный инструмент по сканированию и распознаванию документов. Благодаря успешному развитию технологии оптического распознавания текста в десятой версии продукта значительно улучшилось качество распознавания, и появились новые возможности по экспорту полученных результатов в различные электронные форматы. Если предыдущие версии программы были ориентированы в основном на работу с документами, оцифрованными сканером или сверстанными в PDF, то десятая версия программы умеет распознавать и фотографии, снятые на обычные фотоаппараты или даже мобильные телефоны с камерой. Рассмотрим основные особенности последней версии ABBYY FineReader.

ABBYY FineReader 10
ABBYY FineReader 10

Сканирование и распознавание фотографий

В ABBYY FineReader 10 функция распознавания фотографий в текст существенно ускоряет процесс перевода бумажного документа в электронный вид, так как фотографирование бумаг и документов осуществляется гораздо быстрее сканирования. Технология позволяет перевести в текст даже снятые на мобильный телефон фотографии с низким разрешением – от 2 мегапикселей. Кроме того, процесс ускоряется также за счет того, что пользователю необязательно копировать фотографии с фотоаппарата на жесткий диск ПК. Достаточно просто воспользоваться командой «Получить изображение и распознать» при подключенном фотоаппарате. При этом полученный текст сразу выводится в окне текстового редактора.

ABBYY FineReader 10

ABBYY FineReader 10 позволяет в ходе подготовки изображения к распознаванию провести обработку, повышающую качество результата работы OCR-движка. У обрабатываемой фотографии можно улучшить четкость, применить шумоподавление, исправить некоторые виды геометрических искажений, причем эти операции проходят в автоматическом режиме. В прошлых версиях FineReader условно можно было работать с отснятыми фотографическими изображениями, однако в целом, очень многое зависело от качества съемки. Так, отснятый разворот книги мог некорректно восприниматься OCR-механизмом, поэтому такие страницы содержали "мусор" ближе к сгибу. В новой версии подобные сложности преодолены – движок автоматически "исправит" неверный угол при съемки книги.

ABBYY FineReader 10

Если качество изображения фотографии совсем плохое, то графическим редактором ABBYY FineReader 10 можно пользоваться вручную - программа предоставляет возможность регулировать настройки устранения размытия, обрезать нужную часть изображения с точностью до пикселей. Можно редактировать цветовой спектр изображения благодаря опции «Инвертировать цвета», а также менять качество или удалять часть ненужного текста. Данные настройки изображения, выставляемые в графическом редакторе, можно применить автоматически ко всем изображениям, импортируемым в программу.

Интеллектуальное распознавание элементов и форм

В ABBYY Finereader 10, в отличие от предыдущих версий, улучшилась функция определения структуры сканируемого текста. Это осуществляется благодаря новейшей технологии адаптивного распознавания документов (ADRT - Adaptive Document Recognition Technology), предоставляемой теперь во второй версии (в ABBYY FineReader 9 была ADRT 1.0).

ABBYY FineReader 10

Текст распознается не постранично, как раньше, а сразу как единое целое. Благодаря этому происходит точное определение всех элементов текста, включая заголовки, сноски, подписи под картинками, таблицы, колонтитулы. Если сканирование проводится сразу в определенный формат, например MS Word, то итоговый текстовый документ будет содержать нужные элементы в виде соответствующих форм, а не просто как текст. Это очень существенно упрощает работу, потому что избавляет пользователя от выполнения дальнейших рутинных операций по форматированию в редакторе распознанного текста. В новой версии ADRT позволяет определять еще больше элементов форматирования текста, что позволяет на порядок облегчить процессы вычитки итогового документа в текстовом редакторе. ABBYY FineReader 10 помимо классических функций распознавания отсканированного текста в форматы Microsoft Word, Microsoft Excel, PDF, теперь предоставляет возможности сканирования в HTML, что позволяет создавать многостраничные сверстанные электронные книги с оглавлениям и разбивкой по главам в виде отдельных страниц. Получившийся результат можно скомпилировать, например, для создания файлов справки.

При процессе распознавания используется проверка орфографии для основных 39 языков, в том числе и для нескольких "мертвых". Сам же механизм распознавания приобрел в новой версии поддержку нескольких новых языков, доведя общее количество до 186. При этом качество «понимания» текстов на азиатских языках улучшилось на 30%, а на европейских – на 20%.

В десятой версии существенно расширились возможности работы с PDF. ABBYY FineReader и ранее позволяет осуществлять операции с распознаванием, позже с конвертацией в PDF и из PDF-файлов в популярные офисные форматы, однако реализация подобной функции в приложении имела недостаточно опций. В новой 10-й версии PDF-файл можно сжимать до нужного размера, а также переводить в архивный формат PDF/A, который является оптимальным для хранения PDF-документов. Кроме того, при загрузке приложения появляется интерактивный мастер с уже предустановленным сценарием автоматической переконвертации PDF в Word.

Дополнительные возможности

Для того чтобы упростить распознавание сложного и большого по объему текста, содержащего большое количество специальных символов или своеобразные шрифты, предназначена функция «Распознавание с обучением». Программа предлагает пользователю создать шаблон, содержащий эти нестандартные элементы. Благодаря такому «эталону» ABBYY FineReader 10 может ускорить и оптимизировать распознавание оставшегося объема текста.

ABBYY FineReader 10

Если документ содержит сразу несколько языков, то для упрощения работы можно воспользоваться функцией объединения языков в группы.

ABBYY FineReader 10

Кроме того, для оптимизации работы в ABBYY FineReader 10 можно настраивать менеджер сценариев в соответствии с поставленными целями. Он предполагает составление последовательности выполнения операций в программе и аналогичен макросам, например, в MS Word.

Большим плюсом ABBYY FineReader 10 является совместимость со всеми основными платформами, включая последнюю на сегодняшний день версию Microsoft Windows 7. По существу, среди OCR-продуктов на платформе Windows решение от компании ABBYY занимает уже длительное время лидирующие позиции. Условные "конкуренты" в лице популярных в 1990-х годах приложений для домашних пользователей, несмотря на периодический выпуск новых версий, серьезно отстают как по качеству распознавания, так и по функциональности. ABBYY FineReader, в свою очередь, в каждой новой версии упрощает работу пользования для перевода бумажных документов в электронные форматы, среди которых файлы MS Word, PDF и HTML. Особое отличие программы от предыдущих версий состоит в том, что пользователю больше не нужен сканер, а достаточно самого простого и дешевого фотоаппарата или телефона с камерой, фотографии с которого могут быть качественно распознаны. Кроме того, подобное решение работает быстрее предыдущих версий. Удобный интерфейс, поддерживающий Windows 7, возможность автоматической и ручной обработки изображений для сканирования, улучшенный механизм анализа структуры документа, позволяющий создавать электронные книги, - выгодно отличает новую версию OCR-приложения не только от предыдущих изданий ABBYY FineReader, но и от немногочисленных конкурентов.

Программа выпускается в двух редакциях - ABBYY FineReader 10 Professional Edition и ABBYY FineReader 10 Corporate Edition. Первый вариант предназначен для работы с документами в офисе, а также для личного использования. Второй вариант ориентирован на масштабный документооборот в крупных компаниях (поддержка сетевой установки, администрирование, корпоративная схема лицензирования). Приобрести ABBYY FineReader 10 в России можно у партнеров 1Софт.

 
29.12.2009
Версия для печати Версия для печати Запомнить ссылку Запомнить ссылку
Ваша оценка:  1   2   3   4   5     

 О проектеПерепечаткаАвторамПартнерыО нас пишут
Наверх
©2003—2007. GETINFO.RU. ВСЕ ПРАВА ЗАЩИЩЕНЫ.