Как да си изберем четец за електронни книги?

Файлови формати за електронни книги

Повечето формати за файлове за електронни книги (eBooks) са на базата на xml файловете. Най-интересните формати са тези, които могат да се четат на електронни устройства.

По-надолу се изполва понятието е  Digital rights management (DRM) защита. Digital rights management (DRM) е общо понятие, отнасящо се до технологиите за контрол на достъпа, използвани от издатели и притежатели на авторски права за ограничаване на неразрешеното използване на защитени произведения в цифров вид и/или устройства. Те в повечето случаи представляват софтуер, а понякога комбинация между софтуер и хардуер, които затрудняват създаването на копия от защитени произведения или пък позволяват да се проследят вече създадените такива. Те се появяват за пръв път в средата на 90-те години, за да пазят DVD видеото от нелегално копиране. През 2002-2003 г. започват да се използват по-широко и при продажба на цифрови песни чрез интернет. (източник Wikipedia )

ABW – формат, който е за безплатната текстообработваща програма AbiWord, подобна на Microsoft® Word, с тази разлика, че работи на всички операционни системи. Когато е компресиран форматът е .zabw

BBeB (for Broad Band eBook)
Формат разработен от Sony и Canon за електронни книги и речници, като основно се използва от Sony, известен също като LRF формат.

BBeB има следните разширения:
.lrs – това е xml файл, който е сорс кода на една електронна книга на Sony, lrs използва  Xylog XML формата.
.lrx (криптипан) – когато lrs файлът е  Digital rights management (DRM) защитен, разширението му е lrx.
.lrf (не криптипан)  формат за книги, lrf са компилирани и комресирани lrs файлове.
Следните устройства четат lrf файлове:

BBeB формати за речници
Има само един BbeB формат за речници – .msd

ACSM – Файлов формат за DRM защита на файлове на Adobe eBooks PDF и  ePUB.

При сваляне от Интернет защитени PDF или ePUB файлове, първо се сваля малък файл с разширение .acsm. Този файл се използва от Adobe Digital Editions, за да се изпрати идентификационен номер на сървъра, който ще използва този номер за генериране на криптирани  PDF или ePUB файлове, които ще бъдат записани на компютъра.

AEH – формат, използван от софтуера на Visual Vision – EbooksWriter. EbooksWriter e програма, с която лесно се правят електронни книги (eBooks) дори и от начинаещи. EBooksWriter работи на MS Windows 95, 98, ME, NT, 2000, 2003, XP, XP SP2  и Vista. Програмата, която чете този файл е в една папка с файла.

AZW – формат за електронни книги, изпозван от Amazon за тяхното устройство Amazon Kindle, като е съвместим със софтуера Kindle за PC и iPhone. AZW файловете за електронни книги имат DRM защита.

AZW1 – формат за електронни книги в Topaz (TPZ) формат, който се разпространява с безжичната мрежа на Amazon – Whispernet. Whispernet  позволява достъп до електронни книги за Kindle без да е необходим Интернет.

CBR/CBZ – формат за комикси (CB произлиза от Comic book) или други книги с много графики и изображения. Тези книги обикновено са сканирани или снимани, читателите очакват да могат да увеличат избрана картинка, да прочетат текста, да видят детайли и да прелистват страници. CBR са файлове за изображения, компресирани с rar, а CBZ са компресирани със zip, които могат да се разглеждат като книга. Ако се смени разширениета на файла от CBR на RAR или от CBZ на ZIP, файлът може да се декомпресира.

За да се чете така компресирана книга е нeобходим софтуер. CDisplay е първото приложение, което поддържа CBR формат.

CHM – формат, който се използва за създаване на Help файлове. Освен, че е компресиран, CHM файлът съдържа HTML страници, които са оформени като книга. Операционните системи на Microsoft съдържат програма за четене на тези файлове, наречена hh.exe.

С програмата CHM eBook Reader може да се четат CHM файлове на Pocket PC платформа.

За да се покаже добре CHM файла, браузъра или програмата, която го визуализира трябва да поддържа CSS стилове. В противен случай, съдържанието ще изглежда странно. Примерно Internet Explorer за Pocket PC 2002 не поддържа CSS.

DJVU (произнася се „дежа вю”) – формат, подобен на pdf, създаден от фирмата Lizardtech, който основно се използва за научни публикации – за сканирани документи, които съдържат комбинация от текст и снимки. При този формат снимките и текста се записват като отделни слоеве и качеството е много високо, а компресията много добра.

DNL – формат за електронни книги, който се използва от допълнително приложение на Web браузърите за четене на електронни книги. DRM криптиране се поддържа от този формат, като има и възможност да се прочете част от книгата. Електронните книги се правят с приложението Desktop Author. DNL файловете имат много възможности като търсене на текст, номериране на страниците, подчертаване на текст и др., включително запис и показване на видео.

DOC – формат за документи, който се свързва най-вече с Microsoft Word, като същото разширение се изпозва от електронните книги за PalmOS устройствата. DOC разширението не гарантира отварянето на файла, поради многото версии на този формат.  DOC не се използва в електронните книги, защото Word не е походяща програма за четене на книги и много често се сменят версиите. Една алтернатива на DOC файловете са RTF, които се четат от всички операционни системи и програми, които поддържат DOC.
DOC файловете за устройствата Palm се наричат PalmDoc.

DOCX – нов XML базиран формат, изпозван от Word 2007. По-старите версии на Word могат да се обновят, така че да отварят DOCX

EBA – На много места в Интернат може да се прочете, че това е Mobile Phone data manager файл. Във wikipedia се споменава, че този формат е за eBook, които са на китайски, но не можахме да открием доказателство на тази информация

ePub – отворен формат, внедрен от форума Open eBook Forum of the International Digital Publishing Forum (<idpf>). еPub се базира на XHTML и XML и съчетава в себе си текста, форматирането и потребителския интерфейс. Файлът е компресиран със zip, но разшипението му е .epub. Този формат е предшественик на OEB стандарта. ePub се поддържа от устройства на Sony, Hanlin V3 на Jinke  и др. Adobe са предоставили DRM  за ePub.

-ER.PDB – формат използван от един от най-големите разпространители на електронни книги Fictionwise, собственост на Barnes & Noble за т. нар.  програма еReader. Тази програма позволява четенето на документи за Palm OS. Първите символи –ER се изпозлват, за да се различи, че става дума за pdb формата на Fictionwise

EXE – .exe формата е файл, който се стартира сам и е нобходима програма за показването му

FB2 – FictionBook формат са файлове, базиран на XML. За показването на FB2  файлове има програми за операционните системи Windows, Linux, PocketPC и  Palm OS. Този формат се използва от HaaliReader за PocketPC, универсалната програма за четене на електронни книги FBReader и от безплатната програма за четесне на документи за Palm OS – PalmFiction.

FUB – Franklin Universal Binary, формат за четящото устройство Franklin eBookMan, което вече не се намира на пазара

GPF – Ganaxa Publishing Format- Некриптиран формат разработен от фирмата Ganaxa за платформата на същата фирма – Ganaxa Publishing Platform. Тази платформа е разработена с цел създаването и управлението на съдържанието на електронни вестници, списания и др.

GPX - защитен Ganaxa документ т.е. криптиран GPF формат

HTML – Hyper Text Markup Language, основния формат използван в Интернет. Повечето устройства за четене на електронни книги поддържат стиловете от HTML Cascading Style Sheets (CSS)

IMP – формат за eBook използван от eBook Technologies ETI-1 за устройствата им EBookwise-1150 и REB 1200

-IS.PDB – Формат базиран на PDB формата, разработен за четене от програмата ISilo. Представката IS в началото на формата се използва, за да се различи този формат от PDB формата.  iSilo™ има разработки за Palm OS®, Pocket PC, Windows Mobile Smartphone, Symbian UIQ, Symbian Series 60, Blackberry, iPhone, и  Windows® CE Handheld PC handhelds, както и за Windows® компютри

KML – разширение на формата поддържан от устройствата Hiebook на Корейската фирма Korea eBook.

LIT – DRM защитен формат на Microsoft, който се чете от програмата Microsoft Reader . Повечето Pocket  PC имат вграден Microsoft Reader. Microsoft Reader използва патентованата технология за визуализация Clear Type.

Незащитени LIT файлове мога да се четат и от други програми като Lexcycle Stanza.

Hanlin – eBook на фирмата Jinke също чете LIT файлове.

LRF – формат на Sony, виж BbeB формат

LRS – формат на Sony, виж BbeB формат

LRX – формат на Sony, виж BbeB формат

MOBI – Формат изпозлзван от безплатната програма за четене MobiPocket Reader на фирмата MobiPocket. Собственик на MobiPocket в момента е Amazon. Разширението на файла може да е .mobi или .prc И с двете разширения може да са криптирани или некриптирани. Разширението .prc се използва, защото PalmOs поддържа само .prc или .pdb

Формата MOBI се базира на Open eBook стандарта, който използва XHTML и поддържа Java Script, фреймове и елементарни SQL заявки.

MobiPocket забраняват да се използва тяхното DRM криптиране за електронни книги, които поддържат други видове DRM защита. AZW на Amazon Kindle в същия формат като MOBI, но с друго DRM криптиране.

Забележка: Форматът не поддържа букви с ударения или други знаци.

NP – името на този формат произлиза от News Paper и се използва за online достъп до вестници, използва за техния продукт PressDisplay.

 

OEB – Open eBook формат, използван от EBookwise-1150, MobiPocket, и Microsoft Reader. Този формат е старата версия на ePub.

ODT – Open Document Text, базиран на XML, използван от текстообработвашите програми Open Office и Star Office. В съшност това е Open Document Format (ODF).

OSIS – Open Scripture Information Standard, базиран на XML, използван основно за Библейски текстове и се поддържа от Bible Technologies Group.

PDB – Palm Database Format, този формат се чете от Palm устройствата. eReader е безплатна програма, която поддържа този формат. PDB се поддържа устройството на Barnes & Noble –  Nook .

PDF – Portable Document Format създаден от фирмата Adobe през 1993 за техните Acrobat продукт. Постепенно този формат се наложи като основен при размяната на документи. PDF документа съдържа в себе си вскичко необходимо като шрифтове, изображения, графики и др. за да бъде визуализиран коректно. PDF беше обявен за отворен стандарт през 2008.

PDF не е предпочитан формат за електронните книги. Някои устройства не могат да показват добре PDF документите, защото са форматирани за A4 или letter и не се мащабират добре. Друг недостатък е че файловете са с доста голям размер в сравнение с обикновените формати.

PRS505 на Sony поддържа pdf формата.

Устройствата на iLiad на Irex Technologies също поддържат PDF.

Adobe eBook (PDF) – този формат е подобен на pdf, но е предназначен за по-малки екрани и използва CoolType шрифтове, които са по-лесно четими на LCD екран. Adobe предлагат и софтуерна система за разпространение на електронни книги, наречена ’Аdobe Content Server’.

PKG – разширение, което се чете от Newton MessagePad PDA.

Един .pkg файл може да съдържа няколко книги. Всички ситеми, които имат операционната система Newton (най-известните са Newton MessagePads, eMates, Siemens Secretary Stations, Motorola Marcos, Digital Ocean Seahorses и Tarpons) могат да четат този формат. Newton книгите нямат криптиране или DRM защита.

PNPd –формат използван от програмата eReader за четене на електронно документи за Palm Os.

PRC – Palm Resource Compiler, Mobipocket eBook формат (виж Mobi). Когато в спецификацията на едно устройство се твърди, че поддържат PRC или MOBI формат, става дума за едно и също. Техническа информация за формата може да се намер на адрес: http://web.mit.edu/tytso/www/pilot/prc-format.html

PRC формата се поддържа също и от устройствата за четене на електронни книги на IREX Technologies.

RB – Формат на електронните книги Rocket както и за Gemstar RCA REB 1100, които вече не са на пазара

RTF – Rich Text Format, формат, използван за размяна на документи, който се поддържа от много текстообработващи програми. Предпочитан формат за направа на книги за устройството на Sony

SGF – основен формат за програмата за създаване на електронни книги Sigil

TeBR – eBook формат, направен за някои мобилни устройства, PDA, smartphones, има и версия за Windows. Първата програма, което чете този формат е Tiny ebook Reader - Microsoft Smartphones, Windows Mobile.

TPZ – криптиран формат, който се използва от устройството на Amazon – Kindle. Различава се от AZW формата с това, че в себе си съдържа шрифтове.

TXT – текстов файл, в който няма форматиране и е само ‘plain’ текст. Подходящ е устройствата за четене на електронни книги.

TR – разширение използвано от файлове, направени и четени от програмата TomeRaider. Версията на тези файлове за Palm е .plb Последната версия на този формат е TR3.

VBK – VitalBooks, eBook формат специално направен за текстови книги. Софтуер за четене на тези файлове има за Windows и macOS X.

XDXF – формат за речници с цел свободната им размяна, този формат не е предвиден да се изпозлва за криптирани файлове.

XEB – формат, използван от Apbi eBooks – Китай.

XHTML – подобен на HTML, но с по-строги правила за коректност. Това е стандартем форма за ePub данните.

XML – формат, използван основно за обмяна на данни. За електронни книги се изпозлват XML базирани формати като XHTML и  RSS.

WOLF – вътрешен формат за електронните книги Hanlin на фирмата Jinke

zTXT –  Формат изполван от WeaselReader за Palm устройствата. Това са DOC файлове за Palm (PalmDoc), които са компресирани, разширението им е .pdb