InfoCity
InfoCity - виртуальный город компьютерной документации
Реклама на сайте



Hr бот современные чат боты.



Размещение сквозной ссылки

 

FineReader 5.0 распознает все


Сергей Толокунский, Мой Компьютер


Вопрос "набирать текст вручную или сканировать и распознавать" многие давно уже решили в пользу второго варианта. А все потому, что качество распознавания в последнее время значительно улучшилось. Посему и поговорим мы сегодня об одном из последних достижений в этой области - о программе для оптического распознавания текста. Итак, прошу любить и жаловать - ABBYY FineReader 5.0!

Впрочем, многие уже знакомы с зарекомендовавшими себя очень достойно предыдущими версиями этого приложения. Качество распознавания текстов - и украинских, и русских, и английских - очень приличное. К тому же удобный интерфейс и высокая скорость работы сделали эту программу очень популярной. Кстати, по данным статистики, в нашей стране большинство пользователей работают именно с FineReader'ом 4.хх.
Но ничто не стоит на месте, все меняется, особенно компьютерами, и вот 11 сентября в нашей стране начались продажи новой версии программы - пакета FineReader 5.0.

Интерфейс


Рис. 1 >>>>Пользователи, которым приходилось сталкиваться с предыдущими версиями программы, с легкостью освоятся с пятой. Действительно, интерфейс почти не изменился, привычные окна и кнопки располагаются на знакомых пользователю местах. По умолчанию рабочее пространство разделено на четыре части (рис. 1). Слева расположен узкий столбик, в который помещаются страницы, при этом каждая отображается не простым белым квадратом, а является уменьшенной копией просканированного изображения. Такой подход облегчает "навигацию", еще более упрощая переход от одной страницы к другой - для этого достаточно кликнуть мышкой по соответствующей странице.
В двух других окнах находятся просканированное графическое изображение и распознанный текст. Наконец, в четвертом, расположенном в нижней части экрана, отображается увеличенный фрагмент изображения, соответствующей позиции курсора в окне с текстом. Таким образом, если символ распознан неверно, пользователь всегда может быстро выяснить, что же в действительности было напечатано на бумаге (рис. 2).
Рис. 2 >>>>Окна можно и спрятать, например, если Вам не нужно графическое или текстовое окно - отключите его, соответствующие кнопки находятся на панели под главным меню. Там же располагаются пиктограммы многих функций, перекочевавшие в новую версию FineReader'а из предыдущих. Доступны функции поворота изображения, изменения масштаба, форматирования распознанного текста и др.
Кнопки часто выполняемых операций вынесены на отдельную панель. Здесь вы найдете инструменты для работы с блоками; лупу, приближающую или же, наоборот, отодвигающую изображение; горизонтальные и вертикальные линейки. Не забывайте и о ластике - если нет нужды обрабатывать тот или иной фрагмент изображения, просто сотрите его, и дело с концом!

Scan&Read


Думаю, потратив несколько минут на знакомство с интерфейсом, вы сразу сможете приступить к работе. Специальных знаний тут не требуется: нажмите кнопку Scan&Read - запустится удобный "Мастер", который будет сопровождать Вас во время сканирования. Он спросит, откуда будет вводиться изображение (со сканера или из файла), даст рекомендации по выбору разрешения и прочих параметров. Распознав текст, программа поинтересуется, правильно ли все было сделано. Если нет, "Мастер" задаст ряд вопросов, которые помогут выяснить причину неудачи. Например, недостаточная или излишняя яркость изображения, неправильно выбранный язык оригинала, заданное при сканировании низкое разрешение и т. п.
Приятно удивило, что добавлена возможность автоматического поворота изображения. Даже если пользователь засунул в сканер лист не той стороной, FineReader разберется и автоматически определит правильное расположение оригинала. В некоторых случаях эта функция cможет вас очень выручить: представьте, что Вы отсканировали несколько десятков страниц не той стороной. В недалеком прошлом пришлось бы вручную поворачивать каждую - теперь вместо вас это сделает FineReader.
Несколько изменилась и "идеология" распознавания текста. Раньше процесс был разбит на две части: сначала изображение анализировалось, потом разбивалось на блоки, затем сканировалось. Разбиение на блоки происходит и сейчас, однако данная операция не выделена в отдельную.
Впрочем, это косметическое нововведение, главное, что сама операция выделения блоков выполняется теперь правильнее. Помнится, когда-то, прибегнув к помощи FineReader 4, я пытался "писать" реферат :-), для чего была использована книга по высшей математике, естественно, текст изобиловал различными формулами и рисунками, поставивших FineReader в тупик, конечно, ничего не оставалось делать, как выделять блоки вручную. Нет, новая версия формулы обработать то же не сможет, однако они будут выделены в отдельные блоки и, по крайней мере, не помешают при работе с остальным текстом.
И все же - видимо, на случай текстов непредвиденной сложности, в FineReader 5.0 предусмотрена возможность работы с блоками вручную (соответствующие инструменты вынесены на уже упоминавшуюся панель). Вы можете добавлять, убирать, объединять блоки, тем самым повышая точность и скорость сканирования. Однако, признаюсь честно, за все время работы с пакетом, мне ни разу не пришлось вручную изменять блоки, - программа отлично справлялась с этой задачей.

Язык до Киева доведет :-)


FineReader 5.0 поддерживает достаточное ? количество языков - целых 176! Из них для 30 вероятность выбора правильного варианта значительно повышается - дело в том, что в этом случае FineReader, распознавая тот или иной символ, сверяется со словарем. То есть если в слове "компьютер" программа не будет уверена в букве "м", она залезет в глоссарий и "поймет", что на этом месте должна находиться "м", а не "ш", "щ" и т. п.
В списке поддерживаемых языков - большинство те, на которых разговаривают в Европе и странах СНГ, английский, немецкий, французский, болгарский, польский, татарский, армянский, приятно, что есть украинский и русский и т. д. К слову сказать, готовится версия для иврита. Важно и то, что FineReader распознает смешанные тексты, написанные на различных языках. Но не только с "человеческими" языками работает программа, но и с компьютерными - Pascal, Basic, C++, Java и т. д. Так что теперь можно "писать рефераты" и о программировании :-).

Передай дальше


Но вот текст просканирован и распознан, осталось только проверить орфографию и передать материал в другую программу, например, текстовый редактор. Разработчики рекомендуют проверять ошибки еще в FineReader'е, ведь при этом пользователь сможет все время сверяться с оригиналом. Подтверждаю, это действительно удобно.
Одно из наибольших нововведений - улучшенная запись получившегося текста. Он может быть автоматически передан в Microsoft Word, Excel, программу электронной почты, www-браузер. Поддерживаются форматы DOC, RTF, PDF, HTML... Разработчики очень гордятся тем, что при этом максимально сохраняется структура документа - изображения располагаются в точности как в оригинале, таблицы будут переданы максимально точно (распознается вертикальный текст, объединенные ячейки и т. п.). Сохранится форматирование (в т. ч. верхние и нижние индексы), а в случае, если оригинал был просканирован в цвете - и цветовое оформление текста. FineReader 5.0 позволяет настраивать и "крутизну" HTML-кода - можно включить или выключить поддержку CSS, задать кодировку.

Скорость и качество


Пользователи со стажем наверняка помнят, что предыдущие версии FineReader'а были неприхотливы и с успехом работали даже на слабеньких офисных машинах. Минимальные системные требования новой версии выглядят так - Pentuim 133, 32 Мб памяти, 40 Мб дискового пространства для минимальной установки.
Я попробовал программу на машине класса Pentium 233 MMX. Скажем так, скорость признана удовлетворительной, но могло бы быть и лучше. Впрочем, ABBYY и не скрывает, что в скорости она не прибавила. Аргументы: мол, компьютеры стали гораздо быстрее, в офисе сплошь и рядом используются Celeron 400-500, мы решили сделать процесс распознавания более качественным, снизив при этом скорость. Что ж, такое решение вполне приемлемо, учитывая, что даже на P-233 FineReader 5.0 работает вполне сносно.
А вот качество распознавания текста действительно улучшилось (разработчики уверяют, что в 1.5-2 раза). Я протестировал систему, подкинув ей совершенно неудобоваримый факс, и был поражен результатом. Затем FineReader прошел испытание на прочность статьей из "Моего Компьютера" (с таблицами, цветным оформлением и мелким типографским шрифтом). Опять же, все ОК.

Sprint, Professional, Office


FineReader 5.0 поставляется в нескольких вариантах. Самый простой - Sprint - не содержит функций редактирования распознанного текста, дешевый и чаще всего вкладывается в коробку со сканером в качестве бонуса. Версия Professional стоимостью $99 предназначена для SOHO (малый офис и домашнее использование). Наконец, Office ($399) позиционируется для работы в офисе и содержит развитые сетевые возможности.
Кстати, испытательную версию нового пакета можно совершенно бесплатно загрузить с сайта ABBYY (www.abbyy.com.ua, 24 Мб).

Резюме


Когда выходит новая версия программы (например, вместо 4.64 - 5.0), обычно это означает, что она значительно улучшена, в корне переработано внутреннее устройство, добавлены новые функции. FineReader 5.0 действительно заслуживает того, чтобы называться новой версией, это полностью кардинально изменившийся продукт. И цифра "5" означает "отлично" :-).


Реклама на InfoCity

Яндекс цитирования



Финансы: форекс для тебя








1999-2009 © InfoCity.kiev.ua