3.2. Форматы представления текстовых блоков электронного издания
Еще несколько лет тому назад ответ на поставленный в заголовке данного раздела вопрос был предельно прост: текстовые блоки должны быть в гипертекстовом (HTML) формате или же в формате PDF, так как только эти форматы поддерживали возможность включения в электронное издание мультимедийных компонентов. В настоящее время практически все верстальные пакеты поддерживают не только преобразование издания в формат PDF (или HTML), но и подключение к изданию мультимедиа-компонентов. В частности, в программном пакете PageMaker фирмы Adobe предусмотрена команда Дополнения | QuickTime Mediaв меню Сервис(рис. 3.2), которая обеспечивает подключение к электронному документу объекта в универсальном формате QuickTime, позволяющим работать с любой времязависимой информацией, начиная от аудиоданных и кончая фильмами с несколькими видео– и аудиодорожками.
В широко распространенном в нашей стране текстовом редакторе Microsoft Word, начиная с версии Word 97, предусмотрена возможность включения в состав документа не только анимации в формате GIF, но также и видеофильма в формате QuickTime, видеоклипа в формате AVI, клипа мультимедиа. На рис. 3.3 (слева) показано диалоговое окно Вставка объектаэтого редактора, которое иллюстрирует сделанное утверждение. Кроме того, принятый в этой версии редактора формат DOC стал в полной мере гипертекстовым, так как в нем появилась возможность включать в документ гипертекстовые ссылки как внутренние, для чего в документе делаются специальные закладки, так и внешние – по URL-адресу любого другого документа. В редакторе добавлена также возможность преобразования исходного документа в формат HTML, а также создания специальных HTML-форм. Часть этих возможностей представлена и усовершенствована в новых версиях редактора – MS Word 2000 и Word 2002. В частности, на рис. 3.3 (справа) показано аналогичное диалоговое окно Вставка объектадля этих последних версий редактора Word. Там также имеется возможность вставки в документ видео в формате QuickTime ( QuickTime Movie) и в формате AVI ( Видеозапись).
Рис. 3.2. Интерфейс программного пакета PageMaker c раскрытой командой Дополненияменю Сервис
Таким образом, наряду с форматом HTML и PDF (последний, строго говоря, хранит текст в графическом формате), текстовые блоки электронных изданий могут быть представлены в форматах DOC (MS Word), P65 (для Adobe PageMaker 6.5) и многих других.
В том случае, когда электронное издание не содержит мультимедиакомпонентов, то оно может храниться в формате любого текстового редактора или верстального пакета, единственное дополнительное требование к текстовому редактору состоит в том, что он должен поддерживать графические форматы рисунков, если они включены в текст издания.Для чисто текстовых изданий ограничений еще меньше. Их можно хранить и распространять в любом текстовом формате, используемом в современных персональных компьютерах. В частности, может использоваться формат TXT (в том числе "простой текст" или plain text), гораздо более экономичный, чем формат DOC. Для кодирования любого символа такого текста используется всего один байт. Пример такой кодировки представляет код ASCII (American Standart Code for Information Interchange, Американский стандартный код для обмена информацией). Для языков на основе латиницы и кириллицы такое кодирование вполне удовлетворительно.
Рис. 3.3. Интерфейс и диалоговое окно Вставка объекта редактора MS Word 2002
Однако, для некоторых восточных языков, например, китайского или японского, такой подход неприменим, так как разнообразие символов в этих языках многократно превышает 256 – предельного значения этого параметра в ASCII-стандарте. В последние годы все более прочные позиции приобретает стандарт Unicode или ISO 10646, т. е. стандарт Международной организации по стандартизации (International Organization for Standartization) под номером 10646. В этом стандарте каждый символ кодируется уже 2 байтами, т. е. предельное разнообразие символов достигает значения 65536. Этот стандарт часто называют стандартом многоязыковой поддержки, так как он позволяет кодировать символы государственных языков всех стран нашей планеты.