例二 孤字不成行

例二 孤字不成行

孤字不能成行,大陆出版界不成文的规矩。说起来容易做起来难。

传统模式下只能一个一个硬做,这个不消说了;能想法儿自动化么?

孤字数量的经验公式是孤字公式,就是说,一本856页的《戊戌喋血记》,每行27字,每页平均5个自然段落,理论上应该产生159个孤字。别说清理,把这些孤字找出来都不是一件轻松的事情。好在是小说,如果是个论文,那就还可能涉及到不同字体(比如黑体和仿宋)、不同字号(比如正文区和注释区)和不同的孤字类型。一个汉字后面跟一个句号,不用说是孤字,这是最简单的类型;一个汉字后面先来个尾注号,然后才是句号, 是不是孤字呢,当然也是,这是双重标点孤字;句号后面再跟一个引号,还是孤字,这就是三重标点孤字了。此外,一个字母或数字算不算孤字呢?两个数字呢?加上串文旁置等情况,事情几倍的复杂2

这还不算。孤字清理的一般方法是字距缩放,放还好说,缩就麻烦了,每清理一个孤字,版面上就少一行。不要小看这一行,蝴蝶位置上少这么一行就可能造成全书版面错动,截断表格,排斥插图,最后一直影响到索引和目录。百十个孤字行下来,对全书版面将形成何种影响,不问可知。如果再考虑到作者和编辑的某些最终改动(正文或注解的挖补, 字体字号的改变等等),新的孤字问题和次生问题防不胜防。

孤字处理这么多麻烦,即使在亚动态的系统中都会弄出一身汗来,马虎点儿的编辑只能由它去了。

所有这些麻烦在贺天作坊都烟消云散。DDK专有的ghoxt技术可像篦子一样篦出3每一个孤字,同时自动处理版面上的次生问题,自动适应临时挖补,不留后患。

  • 2. 连同纸型、出血、版口、行宽、版式、字体、字宽、字号、字空、大小写、全半角、制表位、分栏、角标等各种版面元素,全都是孤字编程必须考虑的问题。看上去很简单的一件事,没500行代码下不来。
  • 3. 判读和处理最复杂的版面,50万字,30秒钟。