扬中多语种翻译顾问多重优惠
术语翻译方法(1)基于双语括号句子的术语翻译挖掘方法站在改善***终机器翻译译文质量的角度,我们认为术语翻译知识的质量优先于规模。因此,我们将目光转向互联网上单语网页上大量存在的双语括号的句子。所谓双语括号句子需要同时满足下列三个条件:包含一个或多个括号;紧临括号的左边是一个术语;该术语的译文在括号内。双语括号句子包含丰富的术语翻译知识,如目标语言术语的上下文信息。相对于平行语料或可比语料而言,双语括号句子的限制更少,更新比较及时且相对更容易抽取术语翻译知识。因此我们认为双语括号句子是挖掘术语翻译知识的理想语料。如以下示例所示,挖掘术语翻译知识的主要任务是确定目标术语的左边界,因为右边界已经由括号给出,且源语言术语的边界是确定的。各个进程有自己的内存空间、数据栈等,所以只能使用进程间通讯(interprocesscommunication,IPC),而不能直接共享信息。该方法的输入为种子URL和种子术语词典,***终输出为带概率的术语翻译规则表,类似于统计翻译的短语翻译规则表。在工作流中,中间结果包括主题爬虫获取的Web网页和URL,双语括号句子过滤器筛选出的双语括号句子,术语左边界分类器的术语翻译候选列表,以及增量更新后的种子术语词典。(2)融合双语术语识别的联合词对齐方法词对齐是统计机器翻译的一项核心任务,它从双语平行语料中发掘互为翻译的语言片断,是翻译知识的主要来源。在实践中,一部分词对齐错误就是术语产生的,***终的译文质量也会受到影响。如果能自动识别出平行句对中的术语对应关系,词对齐质量就能得到改善,进而有望改善术语和句子的翻译质量。术语识别方面,基于规则的方法已基本退出历史舞台。基于统计方法的方法虽然不受领域限制,但是对于多词术语和低频术语的识别并不理想,因而抽取的术语也存在较多噪声。所以,如果直接将术语识别结果作为词对齐的约束,术语识别错误就会传递给后续阶段,***终译文质量反而难以得到提升。因此,研究如何提高术语识别和词对齐性能,并提高***终的机器翻译译文质量是迫切需要解决的一个难题。为了尽量降低训练流程中错误传递的影响以改进术语翻译知识抽取,我们提出了融合双语术语识别的联合词对齐方法。首先,为了降低对训练数据的依赖,该联合词对齐方法从单语术语识别弱分类器开始。该分类器由维基百科等自然标注数据训练得到的。其次,为了降低因术语识别和词对齐的错误传递带来的负i面影响,该方法利用双语术语和词对齐的相互约束,将单语术语识别、双语术语对齐和词对齐联合在一起执行,***后得到效果更好的双语术语识别和词对齐结果。(3)融合术语识别边界信息的统计翻译术语解i码方法人名、地名、机构名等命名实体有明显的边界特征,相对容易进行识别与对齐。一般而言,将命名实体直接翻译方法用于统计翻译解i码器就可以取得比较好的翻译效果。但是,用与翻译命名实体的方式“直接翻译”术语并不能明显改善机器翻译自动译文的质量。***主要的原因就是目前的术语识别模型还不够好,识别准确率大幅弱于命名实体识别。另外,由于术语本身是与领域高度相关的,为目标领域训练高性能的术语识别分类器需要大量高质量且同领域的人工标注训练语料,这进一步加大了术语识别的难度。在这种情况下,如果直接将术语识别结果作为词对齐的约束,术语识别错误就会传递给后续阶段,***终译文质量反而难以得到提升。因此,研究如何提高术语识别和词对齐性能,并提高***终的机器翻译译文质量是迫切需要解决的一个难题。短期记忆我们前面提到,短期记忆的容量有限,所以要想改善短期记忆,必须减少记忆的负担。我们可以采取缩写的方法,比如WHO,我们知道是世界卫生***(WorldHealthOrganization)的缩写,我们只要记住这3个字母,把它们作为线索,这样我们就可以记住全部了。另外,我们还可以通过谐音的方法,使毫不相关的对象变得有意义,这样也可以减少记忆的负担。理解错误虽然没有人喜欢承认犯错误,但我们却经常犯错。如果我们学会对翻译错误进行分类,那么我们都可以从中学习到一些知识。此外,在将翻译提交给客户之前,有多种方法可以检查可能出现的错误。我们可能不愿意承认我们犯错误的原因是由于语言能力的欠缺,例如句法使用不当,拼写知识或写作能力薄弱。但这可以通过更多的训练加以弥补。错误也可能是由于大量英语语言的影响渗透到目标语文本中,这些也可以轻松地通过更加仔细的编辑来避免。***后,由于在目标语文本的提交上不够仔细(例如,没有花足够的时间进行修改和编辑),错误也时有发生。解决方案很简单:花费更多的时间进行修改(或者考虑到译者的工作经常有严格的时间限制,所以尽可能多的花时间修改)。翻译的再表达阶段出现错误是很常见的。在准备***终交付前,更仔细地观察有关句法、词法或标点的潜在错误,可以帮助改进翻译。错误分析还可以帮助译员检测并防止问题重复出现。这些分析有助于让我们成为更***的译员,让客户更愉快并愿意再次与我们合作。)