Форматы файлов электронных книг PDF, DjVu, CHM и iSilo.

     Перед теми, кто занимается оцифровкой изданий или набором книг непосредственно на ПК, рано или поздно встает вопрос – в каком формате – поскольку их множество – издавать электронную книгу или, соответственно, в какой формат ее импортировать из текстового.

     Существует несколько групп форматов электронных книг – графические и растровые форматы. Растровые форматы представляют объект в виде множества точек, векторные – в виде простейших геометрических фигур (точки, линии, многоугольники). Таблица внизу классифицирует их именно по этому признаку.

     Однако, как и любая другая, эта классификация условна. Например, PostScript (.ps, .eps), PDF могут быть чисто векторными. Так же DOC, PDF могут содержать только растровые отсканированные картинки или же наоборот – содержать только текст.

     Существует также разделение форматов электронных книг на предназначенные для чтения текста он-лайн и для сохранения на компьютере пользователя. К первой группе относятся файлы такого формата, как HTML и TXT, ко второй – RTF, DjVu, PDF и проч.

     Здесь вы можете узнать краткую справочную информацию о различных форматах электронных книг.

Графические растровые форматы
TIFF Формат для хранения изображений с большой глубиной цвета. Чаще всего используется при сканировании, отправке факсов, распознавании текста, в полиграфии, широко поддерживается графическими приложениями. Глубина изображение делает TIFF незаменимым форматом для тех, кто занимается оцифровкой бумажных изданий, так как процесс распознавания текста упрощается во много раз.
JPEG Данный формат использует сильное сжатие, уровень которого можно регулировать, с потерей информации.
Применяется для хранения высококачественных изображений, позволяет использовать до 16 миллионов цветов, именно поэтому электронные книги в этом формате также имеют место – для печати он непригоден, а для демонстрации на дисплее подходит идеально.
DjVu Использует специальный алгоритм, позволяющий получать файлы меньшего размера при сжатии без потерь за счет технологии, разработанной специально для хранения оцифрованных документов рукописей, книг, журналов. Популярнейший формат книг в файлообменных сетях.
Графические векторные форматы с оформлением
RTF Формат, поддерживаемый большинством текстовых редакторов, созданный для документов в среде ОС Windows. обеспечивает возможность сохранения структуры текстовых документов, позволяет выделять их фрагменты (курсивом или жирным шрифтом, создавать колонки и т. п.). Книги в формате RTF доступны для скачивания во многих книгообменных сайтах.
HTML Стандартный язык разметки документов во Всемирной паутине. Разметка позволяет вставку спецсимволов, изменение размера, типа, начертания шрифта, создание гиперссылок и таблиц, выравнивание текста. Электронные книги в формате HTML чаще всего выставляются в полнотекстовом виде на сайте, в этом случае в скачивании на компьютер нет необходимости.
OPF FlipBook Открытый формат электронных книг – стандартная версия программы FlipAlbum создает альбомы-книги FlipBooks с расширением OPF (Open Electronic Book Package Format). Эти файлы могут быть просмотрены с помощью самой программы или бесплатной утилиты для работы с OPF-файлами.
CHM Книга – файл формата .chm (HTMLHelp). Содержит в себе набор HTML-страниц , может также включать в себя содержание со ссылками на страницы, предметный указатель, а также базу для полнотекстового поиска по содержимому страниц. Используется для создания справки в ОС Windows и, по аналогии, для создания книг, с помощью специального программного обеспечения.
SGML Стандартный общий язык разметки для документов. Широко используется в издательском деле – рукописи зачастую передаются в электронном SGML-структурированном виде, что значительно облегчает работу наборщиков и дизайнеров.
XML XML – текстовый формат, предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки. XML позволяет легко создавать документы, готовые к непосредственному использованию и программной обработке (конвертации, хранению, управлению) в любой среде, поэтому на его основе создан формат FictionBook.
FB2 Открытый формат, основан на XML. Основное преимущество FictionBook(.fb2) – возможность без труда создавать (в том числе и автоматически) книги в этом формате из файлов всех популярных текстовых форматов (*.txt, *.doc, *.rtf. *.html и пр.). Кроме того, FictionBook поддерживается большинством распространенных программ и устройств для чтения книг.
FB3 Формат fb3 разрабатывается для удовлетворения возросших требований к форматированию текста книг и возможностям их каталогизации. Современное состояние стандартов и технологий позволяет, помимо простого расширения набора тегов, привести формат к совместимости с наиболее удачными и перспективными наработками. В частности, в основу fb3 положен стандарт Open Packaging Convention (ECMA-376 Part 2). Помимо этого в качестве картинок можно использовать SVG-файлы (и GIF-файлы, патент на которые закончился).
TEX TEX – система вёрстки, разработанная в целях создания компьютерной типографии. В неё входят средства для секционирования документов, для работы с перекрёстными ссылками и для набора сложных математических формул. Документы набираются на собственном языке разметки в виде файлов, содержащих информацию о форматировании текста или выводе изображений. Электронные книги обычно имеют расширение .tex, конвертируются специальной программой в файлы «.dvi», которые могут быть отображены на экране или напечатаны. DVI-книги можно специальными программами преобразовать в PostScript, PDF, или другой электронный формат.
PDF Формат электронных документов, созданный фирмой Adobe Systems с использованием ряда возможностей языка PostScript. Обычно используется для книг с иллюстрациями (в т.ч. схемы и математические формулы). PDF – формат, позволяющий внедрять необходимые, векторные и растровые изображения, формы и мультимедиа-вставки.
LIT Фирменный формат Microsoft (.lit) , достаточно распространенный, в том числе из-за поддержки производителя. Существует некоторое затруднение с прочтением, поскольку формат читается в основном с помощью Microsoft Reader, официального ПО. Microsoft LIT включает ряд функций, из-за которых его считают очень похожим на Adobe PDF: закладки, аннотации и масштабирование.
PostScript и EPS PostScript (.ps)- язык составления документов, главная функция – описание страниц, чтобы при выводе на печать они выглядели так же, как на экране. Формат EPS (Encapsulated PostScript) был создан для сохранения графики (содержащей изображения всех типов, контуры, текстовые поля и др. – в том числе и электронных книг), предназначенной для печати на «PostScript-принтерах». EPS, в котором, как правило, сохраняют конечный результат работы, это упрощенная версия формата PostScript.
ExeBook Книга в формате ExeBook – по сути, Win32-приложение, скомпилированное с помощью специального программного обеспечения. Основной особенностью книги в формате EXE является ее максимальная приближенность к бумажному аналогу.
RBS RBS (Radix-Tools REBUS) – это защищенный формат, основанный на HTML и включающий в себя текстовый, графический, мультимедиа-контент и интерактивные составляющие. Использование в формате HTML-языка позволяет легко конвертировать файлы практически любого формата в RBS-вид с помощью специального ПО. В электронном виде в формате RBS может быть представлено множество типов бумажных изданий, как то – учебные и контрольные тесты, анкеты – результаты опросов, картографические документы, справочники, энциклопедические материалы и художественная литература.
PRC Сжатый формат PRC – так называемый Palm-формат, использует механизм шифрования контента электронной книги, что обеспечивает защиту интеллектуальной собственности при ее продаже. Файлы с расширением PRC используются для электронных книг в формате Mobipocket Reader для чтения книг на кпк и телефонах .
ePUB Формат, основанный на XML. Позволяет издателям производить и распространять цифровую публикацию в одном файле, обеспечивая совместимость между программным и аппаратным обеспечением, необходимым для воспроизведения незашифрованных цифровых книг и других публикаций с плавающей версткой».
Простой текст (plain text)
TXT Файлы формата TXT имеют наименьший вес, поэтому зачастую использовались в самом начале эры электронных интернет-библиотек, у посетителей которых была предельно низкая скорость скачивания, равно как и объемы жестких дисков, а также различных носителей. Для того, чтобы скачать крупное издание, создавались ZIP-архивы, объединяющие все главы книги. Основной плюс TXT – его совместимость со всеми устройствами и практически любым программным продуктом, Хотя данный формат и не поддерживает графику и сложное форматирование.


По материалам ОЧЕНЬ ИНФОРМАТИВНОГО сайта : http://leeet.net/ ,
Более подробно - здесь : http://leeet.net/ru_formats.php