Свежий номер №33 (362) / Чего не может быть?
 
Сергей Голубицкий, sergei@internettrading.net, 27.09.2000

Похоже, мне следует каждую «Голубятню» предварять объяснением:
«Это — авторская колонка, а не тестовая лаборатория. Автор описывает свои собственные субъективные впечатления, а не борется вместе с внуками первых большевиков-ленинцев за правду-матку капитализма».

Несколько перфекционистов (по большому счету, слепленных из того же теста, что и я сам) не поленились отсканировать прямо из журнала отрывок диссертации, прогнать его через четвертый FineReader и, получив читаемый результат, доказать несостоятельность моего Acid Test’а. Я искренне счастлив за этих людей, которые не пожалели времени на развенчание моих ламерских экзерсисов. Но вот незадача: у меня лично получился именно тот результат, о котором я написал (если, конечно, не впасть в маразм, предположив, что я собственноручно нарисовал картинку с OCR четвертого «Файнридера»), и меня не волнует, по какой причине это случилось: то ли сканер у меня кривой, то ли руки. Я воспроизвел собственные результаты и собственные впечатления, а не проводил лабораторный анализ. Пишет же в двух страницах от меня служитель неведомого культа о превосходстве НАТО над сербской армией, пишет об умных фрактальных пушках и чудо-бомбах, при этом даже не задумывается о том, что достаточно, предварительно пригласив журналистов, отпилить тупым предметом пару голов в кевларовых касках у этих непобедимых вояк, и на этом, скромно полагаю, всякая война закончится. Однако святой отец пишет только о том, что ему нравится, — почему? Да потому, что это его Кафедра, а не моя.

Вообще же, людям, имеющим дело с компьютерами, следует быть сдержаннее по части того, что может быть, а чего быть не может. У меня вот сегодня утром на диске С: появились две идентичные папки Windows (рис. 1).

Рисунок 1
Две идентичные папки Windows

Этого, вроде, не может быть. Если вы мне не верите, то вот вам еще — картинка из Word’а на компьютере Дениса Викторова (рис. 2).

 Рисунок 2
Картинка из Word'a

Два меню «Файл» — это тоже «не может быть»? Короче говоря, пора отвыкать от генетически абсорбированного восприятия печатного слова как некой истины в конечной инстанции. «Голубятня» — это субъективные эссе, которые основная масса читателей потребляет ради стиля, а за правдой — ходят к Хрупалову.

Сегодня я расскажу об одной милой маленькой утилитке — HTML Batch Editor (batch-editor.homepage.com). Понадобилась она мне в необычном контексте, который сам по себе заслуживает внимания.

Последнее время я все больше разочаровываюсь в способности Интернета выдавить из себя мало-мальски достойное содержание. Беспросветный поток убогого скудоумия, нескончаемого ерничества и стебания, причем совершенно без разницы, где — в американском отсеке или в Рунете, — удручает не меньше Голливуда. Хотя удивляться не приходится: вопреки своей технологической продвинутости Интернет — это задворки культурного поля, где сбылась мечта голубого русина Энди Уорхолла о пятнадцати минутах славы для всякой ложки человеческого повидла.

Все это породило во мне тоску по старой доброй книжной культуре. Недавно поймал себя на мысли, что блуждание по amazon.com и biblion.ru (два любимых онлайновых книжных магазина), а также охота за новыми электронными текстами (которая всегда начинается с чудесной библиотеки Мошкова — www.lib.ru) отхватывает львиную долю свободного от работы времени.

Интрига сегодняшней «Голубятни» связана с электронными текстами. Всякий, кому приходилось скачивать на свой диск так называемые eBooks, знает о мешанине форматов: это и rtf, и микрософтовский doc, и html попеременно в трех кодировках — KOI-8R, CP-1251, -866, и просто ASCII-текст, и pdf.

Мой личный алгоритм работы с eBooks следующий: после закачивания файлу дается осмысленное название, он помещается в соответствующий тематический каталог, затем индексируется в электронном архиве, который я веду с помощью любимца CROS’a. Но начинается все с главного вопроса — в каком формате хранить eBook? Если рассматривать электронную библиотеку как мертвое хранилище мудрости, то вопрос формата снимается автоматически, поскольку любой файл, в конце концов, можно открыть если не одной программой, так другой. Да и электронные архивы типа Cros производят индексацию в любой кодировке и в перечисленных мною форматах (кроме pdf). Все это так, если хранилище мертвое. Ну а если — живое? Если ежедневно на свет извлекаются десятки электронных книг, сравниваются темы, идеи, стиль? При таком подходе унифицированный формат становится не просто удовольствием, но и полезностью. После долгих экспериментов я остановился на HTML-тексте.

Следующий логичный шаг — переформатирование. И тут очень кстати мне подвернулся HTML Batch Editor, созданный для поточной обработки документов в формате html. Маленькая утилитка на лету позволяет преобразовывать сложные таблицы в текст, удалять скрипты и апплеты, формы, видео- и звуковые линки, комментарии, списки, менять тип и размер шрифтов, удалять заданный текст или текстовый блок, а также заменять его. Изюминка HTML Batch Editor — опция Set for PDA, которая позволяет обработать поток документов таким образом, чтобы они с максимальным удобством читались через компьютеры-наладонники.


Сергей Голубицкий
sergei@internettrading.net
 


<< Фильтруют все!
Все материалы номера
Почему у японцев все получается? >>