Все выше и выше 23.09.2003 Дмитрий Шарапенко Когда я вижу пресс-релиз об очередной версии какой-либо программы, то каждый раз с большим интересом изучаю приведенные в нем цифры. Потому что практика показывает — чем больше цифр в тексте, тем меньше в них смысла. «Производительность возросла на столько-то процентов», «добавлено четыре новых модуля», «два новых словаря»… Бесконечное увеличение и разрастание всего, что только возможно. Я, конечно, прекрасно понимаю, что цифры продавать легче всего: вроде как если чего-то стало больше, значит, и продукт стал лучше. А хотелось бы видеть совсем иные фразы. Например: «В новой версии нашего продукта мы еще больше упростили интерфейс и снизили общее количество инструментов еще на N. Точность и стабильность работы программы теперь позволяет сократить вмешательство наших любимых пользователей еще на N%. Теперь Вам достаточно запустить нашу программу и выбрать, какой результат Вы хотите получить». Не это ли путь для развития? Подобные мысли посещали меня, пока я устанавливал только что вышедший FineReader под номером 7. До определенного момента эта программа от версии к версии приятно удивляла своими качественными изменениями. С увеличением порядкового номера рос не только объем программы, но и заметно улучшалось качество распознавания текста. Да и добавление новых языков распознавания действительно шло на пользу потребителю. Первый тревожный звоночек прозвучал около года назад. Это мое чисто субъективное мнение, но когда у меня на столе лежит лицензионный диск с программой, я ее устанавливаю, а мне сообщают, что для полноценной работы еще нужно выйти в Интернет и что-то там активировать, то волей-неволей возникает раздражение. Плюс ко всему видимых глазу отличий шестая версия не представила: вроде стало лучше — а вроде и нет. Впрочем, появилась поддержка работы с PDF, за что разработчикам огромное человеческое спасибо. Больше, однако, ничего не запомнилось. От седьмой версии я ожидал если не чудес, то хотя бы сюрпризов. Причем заметных мне — простому «некорпоративному» пользователю. И первым сюрпризом оказался пресс-релиз на сайте компании, сообщающий о том, что: - седьмая версия FineReader стала на 25% точнее; Наверное, с точки зрения отдела маркетинга это звучит неплохо. С точки зрения пользователя — не несет абсолютно никакой информации о продукте. Если бы методика внутренних тестов была уточнена — возможно, она бы разрешила мое недоумение. Что ж, придется изобрести маленький велосипедик самому. В качестве «тестовых заданий» я выбрал три образца: рекламную брошюрку одного американского автомобиля, отсканированную и сохраненную в JPG (проверяем распознавание нечеткого текста); ксерокопию книжки XIX века (сохранение макета); извещение об оплате электричества от Мосэнерго (сохранение макета, низкая контрастность и цветной текст на цветном фоне).
Что ж, в целом — очень неплохо. Однако слишком тесная работа механизма распознавания со словарями приводит к появлению слов, верных с точки зрения грамматики, но неверных по смыслу (например, «that’s» превратилось в «trial’s»). И если я решу проверять текст не в FineReader’е, а в каком-либо текстовом редакторе, то подобные вещи нельзя будет отловить без тщательной вычитки текста.
Революции не произошло, и табличек не появилось. Даже при указании типа блока «Таблица». Может быть, у меня слишком экзотичные требования, но мне такой вид представления табличных данных попадается очень часто. И мне кажется, что научить программу анализировать интервалы между словами и делать соответствующие выводы при их закономерном изменении (тем более когда тип блока задан вручную), вполне реально.
И тут я не был разочарован — получилось. Дабы не занимать место на журнальной полосе, результат приводить не буду. Но можете поверить на слово: несмотря на отдельные ошибки в тексте, общий макет был сохранен почти на сто процентов, что меня, как пользователя, вполне устраивает. Подведем итоги. Видно, что ребята из ABBYY покорпели над FineReader’ом. Но, разумеется, сколько там и где процентов прироста — сказать невозможно. Работа со стандартными офисными бумагами, как обычно, на высоте, и хорошо отпечатанные таблицы средней сложности тоже проглатываются без проблем. Но если у вас уже стоит пятая или шестая версия программы, то немедленно бежать и разыскивать седьмую смысла нет — никакого прорыва не случилось. Если до сих пор кипяти… то есть пользуетесь другой OCR-программой — смело ставьте FineReader, будете приятно удивлены. Хотя в наличии сколь-нибудь значительного числа таких «кипятящих» у меня серьезные сомнения: на отечественном рынке OCR-систем ABBYY осталась практически монополистом; единственный конкурент — компания Cognitive Technologies со своей программой CuneiForm — за последние три года не выпустила ни единой новой версии продукта (вернейший признак того, что пациент скорее мертв, чем жив). И — что поделать — морально готовьтесь к потокам новых, ничего не значащих, цифр: похоже, что соцсоревнования с количеством тонн чугуна на душу населения вновь возрождаются в качестве основного «штиля» в рекламных отделах софтверных компаний.
|