中国自动化网为网民提供全面的工业自动化资讯、自动化商务信息。

自动化 > 自动化 > 机器翻译-求介绍比较好用的机器翻译系统?

机器翻译-求介绍比较好用的机器翻译系统?

当前栏目:自动化|发布者:阿坚|来源:自动化网|发布时间:2020-05-07 09:33:04|阅读:

本篇文章2908字,读完约7分钟

科技的进步使很多产业都实现了机械化,相信大家对自动化设备多多少少都了解一下,今天自动化设备网小编在这里为大家介绍机器翻译的一些基础知识,希望能给大家带来一些帮助。

建议你试一下新译科技机器翻译,一直在用,很方便,其次应用领域也很广泛,比如zhuan利、法律、会议报告、电商、医学、航天、简历书信、军事、议会、旅游等领域的高品质翻译。机器翻译英语。

机器翻译的基于统计同声翻译机器。

一般的基于语料库(Corpus-Based)的机译系统就是基于统计的机器翻译,因为这一领域异军突起,统计就是统计平行语料,由此衍生出许多不同的统计模型。

不同于基于规则的机译系统由词典和语法规则库构成翻译知识库,基于语料库的机译系统是以语料的应用为核心,由经过划分并具有标注的语料库构成知识库。基于语料库的方法可以分为基于统计()的方法和基于实例()的方法。 基于统计的机器翻译 基于统计的机器翻译方法把机器翻译看成是一个信息传输的过程,用一种信道模型对机器翻译进行解释。这种思想认为,源语言句子到目标语言句子的翻译是一个概率问题,任何一个目标语言句子都有可能是任何一个源语言句子的译文,只是概率不同,机器翻译的任务就是找到概率最大的句子。具体方法是将翻译看做对原文通过模型转换为译文的解码过程。因此统计机器翻译又可以分为以下几个问题:模型问题、训练问题、解码问题。所谓模型问题,就是为机器翻译建立概率模型,也就是要定义源语言句子到目标语言句子的翻译概率的计算方法。而训练问题,是要利用语料库来得到这个模型的所有参数。所谓解码问题,则是在已知模型和参数的基础上,对于任何一个输入的源语言句子,去查找概率最大的译文。

实际上, 用统计学方法解决机器翻译问题的想法并非是 20 世纪 90 年代的全新思想,1949 年W. Weaver 在那个机器翻译备忘录就已经提出使用这种方法,只是由于乔姆斯基(N.Chomsky) 等人对计的批判,这种方法很快就被放弃了。批判的理由主要是一点:语言是无限的,基于经验主义的统计描述无法满足语言的实际要求。机器翻译

另外,限于当时的计算机速度,统计的价值也无从谈起计算机在速度和容量上都有了很大的提高。如今,小型工作站或个人电脑可以完成大型电脑过去所做的工作。此外,统计方法在语音识别、字符识别、词典编纂等领域的成功应用也表明了该方法在自动语言处理领域的有效性。

统计机器翻译方法的数学模型是由IBM的研究人员提出的。在著名的《机器翻译数学理论》一文中,提出了一个从五个词到五个词的统计模型,称之为IBM模型1到IBM模型5、这五种模型都是从源信道模型出发,采用极大似然法进行参数估计。由于当时(1993年)计算条件的限制,无法实现大规模的基于数据的训练。此后,Stephan-Vogel提出的基于隐马尔可夫模型的统计模型也受到重视,并被用来代替IBM模型2、在本研究中,统计模型只考虑词与词之间的线性关系,而不考虑句子结构。当两种语言的词序完全不同时,这可能不太有效。在考虑语言模型和翻译模型时,如果考虑句法结构或语义结构,应该会得到更好的结果。怎么检测机器翻译。

机器翻译:机器翻译可以替代人工翻译了吗?

机器翻译:机器翻译可以替代人工翻译了吗?

本文发表6年后,一群研究人员在约翰霍普金斯大学机器翻译夏令营中实现了Giza软件包。弗朗兹·约瑟夫·奥赫后来优化了软件,以加快训练速度。特别是IBM model 3到5培训。同时,他提出了一个更复杂的模型6、och发布的软件包名为Giza 。到目前为止,Giza 是大多数统计机器翻译系统的基石。对于大规模的语料库训练,Giza 有几个并行版本。

但是,由于建模单元太小,基于词的统计机器翻译的性能受到限制。因此,许多研究者转向基于短语的翻译。Franz-Josef-och基于最大熵模型的判别训练方法大大提高了统计机器翻译的性能。在接下来的几年里,这种方法的性能远远领先于其他方法。一年后Och又修改最大熵方法的优化准则,直接针对客观评价标准进行优化,从而诞生了今天广泛采用的最小错误训练方法(Minimum Error Rate Training)。

另一件促进统计机器翻译进一步发展的重要发明是自动客观评价方法的出现,为翻译结果提供了自动评价的途径,从而避免了繁琐与昂贵的人工评价。最为重要的评价是BLEU评价指标。绝大部分研究者仍然使用BLEU作为评价其研究结果的首要的标准。机器英文。

Moses 是维护较好的开源机器翻译软件,由爱丁堡大学研究人员组织开发。其发布使得以往繁琐复杂的处理简单化。机器翻译模型。

Google 的在线翻译已为人熟知,其背后的技术即为基于统计的机器翻译方法,基本运行原理是通过搜索大量的双语网页内容,将其作为语料库,然后由计算机自动选取最为常见的词与词的对应关系,最后给出翻译结果。不可否认,Google 采用的技术是先进的,但它还是经常闹出各种“翻译笑话” 。其原因在于:基于统计的方法需要大规模双语语料,翻译模型、语言模型参数的准确性直接依赖于语料的多少,而翻译质量的高低主要取决于概率模型的好坏和语料库的覆盖能力。基于统计的方法虽然不需要依赖大量知识,直接靠统计结果进行歧义消解处理和译文选择,避开了语言理解的诸多难题,但语料的选择和处理工程量巨大。因此通用领域的机器翻译系统很少以统计方法为主。 基于实例的机器翻译 与统计方法相同,基于实例的机器翻译方法也是一种基于语料库的方法,其基本思想由日本著名的机器翻译专家长尾真提出,他研究了外语初学者的基本模式,发现初学外语的人总是先记住最基本的英语句子和对应的日语句子,而后做替换练习。参照这个学习过程,他提出了基于实例的机器翻译思想,即不经过深层分析,仅仅通过已有的经验知识,通过类比原理进行翻译。其翻译过程是首先将源语言正确分解为句子,再分解为短语碎片,接着通过类比的方法把这些短语碎片译成目标语言短语,最后把这些短语合并成长句。对于实例方法的系统而言,其主要知识源就是双语对照的实例库,不需要什么字典、语法规则库之类的东西,核心的问题就是通过最大限度的统计,得出双语对照实例库.机器翻译需要的技术。

基于实例的机器翻译对相同或相似文本的翻译有着非常重要的影响。随着示例数据库规模的增大,其效果越来越显著。对于案例库中已有的文本,可以直接得到高质量的翻译结果。对于实例库中与实例非常相似的文本,可以通过类比推理构造近似翻译结果,并对翻译结果稍加修改。

这种方法刚推出时就受到许多人的高度赞扬。但过了一段时间,问题就出现了。由于该方法需要大量的语料库作为支撑,实际对语言的需求很大。然而,受语料库规模的限制,基于实例的机器翻译很难达到很高的匹配率,只有局限于狭窄的或专业的领域,翻译效果才能达到要求。迄今为止,很少有机器翻译系统采用纯基于案例的方法。通常,基于实例的机器翻译方法被用作多翻译引擎之一,以提高翻译的准确性。

以上就是关于机器翻译:求介绍比较好用的机器翻译系统?的内容,如果您对自动化设备有疑问或者有购买意向,可以直接向我们提问以及购买,自动化设备网小编期待您的来电咨询。


特别声明:本站的所有文章版权均属于自动化网,未经本网授权不得转载、摘编或利用其它方式使用上述作品,已经本网授权的文章,应在授权领域内应用,并注明来源为:“自动化网”。。

标题:机器翻译-求介绍比较好用的机器翻译系统?    地址:http://www.mingkongzdh.com/article/532.html

相关推荐: