多字体字号混排电子书制作心得

近期入手一个Kindle 3,在网上发现一套制作不错的《资治通鉴》,于是花了几天时间研究了一下,做出多字体的电子书。
过程中试用了Mobipocket Creator、Calibre、ecub、Jutoh等多种工具,部分是MAC OS X平台,部分是Win平台。介绍下心得:
1.电子书格式问题:
Kindle原生支持azw,但是这个Amazon的格式制作麻烦,目前很少见一体化的工具。SONY的PRC和跨平台的MOBI比较常见,此外就是Apple采用的epub了。这些格式都是类似TXT的显示,但是提供丰富的封面、目录等功能。其中mobi和prc格式较老,对很多HTML标签支持不好。比如<span>中对字体、字号的定义,mobi中<i>斜体我也没能做出来(官方文档中说是支持的);mobi和prc实际也不支持内嵌不同字体,因此要实现多种样式同行混排(比如正文雅黑、注释幼圆),只能老老实实用不同字号来区分吧;
2.混排的选择:
如果源文件是TXT,那么Word调整格式是很方便的,适合制作多字体的文件,建议充分利用替换里的高级选项和样式功能做混排。样式也有助于自动生成目录。
3.中间文件的选择:
建议使用HTML为中间文件,因为上面提到的各种电子书格式可以说都是基于HTML的。Mobipocket Creator是可以直接导入Word文件的,但做复杂混排时不推荐,因为导入过程实际上是调用Word转换为HTML,这样会丢失掉字体定义等(当然还是因为<span>的问题)。Word导出为HTML时建议选择“筛选的网页”,这样可以去掉大量的冗余代码;即便如此,导出的HTML还是需要用文本编辑器(推荐UltraEdit)或者Dreamweaver等工具处理,通过正则表达式去除冗余的或者需要调整的代码。比如第1点提到<span>的问题,就需要批量转用<font>;