例四 从“正文”中析出页下注

例四 从“正文”中析出页下注

正文和页下注不分彼此地混合在一个版面中,这种情况经常遇到。比如断版书,重新 导出的电子文本几乎一定是这样。

页下注必须析出,但从几百几千页“正文”中用手工析出显然是不能考虑的。原始的 工作方式不仅意味着巨大的工作量,同时也隐含着出错的风险,无论如何都需要另辟蹊径。

DDK提供这个蹊径。管他多少个P,把混合文本交给我们就是,明天早上我们就可以 把析出的文本放到您的桌上,正文归正文,注释归注释,小葱拌豆腐,一青二白。

我们有信心完成这类工作,理由很简单:页下注一定是有某种特征6的,如果人能根据 这种特征析出页下注,DDK 也一定能完成同样的析出,而且一定会做得更好

  • 6. 当然是某个布尔特征,完全根据文义来判断页下注是不可想象的。张三和李四的判断绝对不可能完全一致,要想完 全一致,必须有某种刚性的取舍标准,非此即彼,容不得一点含糊。