机器翻译的流程是怎么样的

如题所述

推荐答案 2015-12-15

著作权归作者所有。
商业转载请联系作者获得授权，非商业转载请注明出处。
作者：王biubiu
链接：http://www.zhihu.com/question/24588198/answer/38342825
来源：知乎

目前最重要的两种机器翻译方式：规则法和统计法
1. 规则法（rule based machine translation, RBMT），依据语言规则对文本进行分析，再借助计算机程序进行翻译。多数商用机器翻译系统采用规则法。
规则法机器翻译系统的运作通过三个连续的阶段实现：分析，转换，生成，根据三个阶段的复杂性分为三级。
- 直接翻译：简单的词到词的翻译。
- 转换翻译：翻译过程要参考并兼顾到原文的词法、句法和语义信息。因为信息来源范围过于宽泛，语法规则过多且相互之间存在矛盾和冲突，转换翻译较为复杂且易出错。【别说转换了，光是根据各种语法规则，对源语言进行分析都会崩溃好吗！
- 国际语翻译：迄今为止，还只是设想。大概是想凭借通用的完全不依赖语言的形式，实现对语言信息的解码。【国际语本身就是人工语言啊，还怎么做到不依赖语言形式。这个想法最早出现在13世纪orz
著作权归作者所有。
商业转载请联系作者获得授权，非商业转载请注明出处。
作者：王biubiu
链接：http://www.zhihu.com/question/24588198/answer/38342825
来源：知乎

Bernard Vauquois' pyramid

2. 统计法（statistical machine translation, SMT），通过对大量的平行语料进行统计分析，构建统计翻译模型（词汇、比对或是语言模式），进而使用此模型进行翻译，一般会选取统计中出现概率最高的词条作为翻译，概率算法依据贝叶斯定理。假设要把一个英语句子A翻译成汉语，所有汉语句子B，都是A的可能或是非可能的潜在翻译。Pr(A)是类似A表达出现的概率，Pr（B|A）是A翻译成B出现的概率。找到两个参数的最大值，就能缩小句子及其对应翻译检索的范围，从而找出最合适的翻译。
SMT根据文本分析程度级别的不同分为两种：基于词的SMT和基于短语的SMT，后一个是目前普遍使用的，Google用的就是这种。翻译文本被自动分为固定长度的词语序列，再对各词语序列在语料库里进行统计分析，以查找到出现对应概率最高的翻译。【所以，不要嫌弃谷歌翻译啦，如果不是依托于它自己强大的搜索引擎，能获取相对数量的语料库，翻译的质量可能更糟，可以对比必应和百度。非在线的开源机器翻译也有做得很棒的，多也是使用的统计法模式。
著作权归作者所有。
商业转载请联系作者获得授权，非商业转载请注明出处。
作者：王biubiu
链接：http://www.zhihu.com/question/24588198/answer/38342825
来源：知乎

其他方式还有如范例法（example based machine translation, EBMT），类似统计法原理，不同的点在于比对对象是相对小型的语料库，从中找到对应的翻译片段的类似范例，再用片段组成相应的翻译;上下文法（context based machine translation, CBMT）;知识法（knowledge based machine translation, KBMT）和混合法，但是不及前面两种使用率高。

刚好这两天在看Daniel Stein写的MT概述"Maschinelle Übersetzung – ein Überblick"，有提到机器翻译的不同类型和原理，以上。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/WjeO7te7vvOvXvteBOO.html

相似回答

机器翻译的流程(原理)是怎么样的?答：机器翻译的预处理阶段是对Source进行规整。将长句变为几个短句，在删去不必要的部分，调整表达不规范的地方。核心处理阶段是机器翻译的核心步骤。核心处理将Source的字符单元、序列翻译成Target的序列。后处理阶段是将翻译结果进行拼接调整，使它符合人们的阅读习惯。其中包括:建模单元的拼接、字母大小写的转化...

机器翻译的流程(原理)是怎么样的?答：第1步：将原始句子分成块首先，我们将我们的句子分成简单的块，每一块都可以轻松翻译：第2步：找到每一块的所有可能的翻译接下来，我们将翻译每块文字，我们将通过寻找我们数据库中所有人类翻译过的相同词块来完成我们的翻译。要着重注意的是，我们不只是在一本简简单单的翻译字典中查找这些词块。相反，...

机器翻译的流程是怎么样的答：规则法机器翻译系统的运作通过三个连续的阶段实现：分析，转换，生成，根据三个阶段的复杂性分为三级。- 直接翻译：简单的词到词的翻译。- 转换翻译：翻译过程要参考并兼顾到原文的词法、句法和语义信息。因为信息来源范围过于宽泛，语法规则过多且相互之间存在矛盾和冲突，转换翻译较为复杂且易出错。【别...

统计机器翻译基本流程答：统计机器翻译，如同多数机器学习过程，主要分为训练和解码两阶段。训练阶段旨在学习模型参数，而解码阶段则是利用这些参数寻找最佳翻译结果。对于基于短语的统计机器翻译，其训练过程可能包含词对齐和短语抽取等步骤，虽然严格来说，只有最小错误率训练可以明确称为训练阶段。获取平行语料是第一步，这些数据中的...

机器翻译是怎么进行翻译的啊?答：翻译工作者借助术语数据库的作用可以提高翻译速度和翻译质量，促进术语的统一。在医学翻译方面尤其实用。计算机辅助翻译：CAT，与机器翻译不同，其是使用计算机工具帮助译者翻译文本。主要技术有翻译记忆库TM和术语库TB。与人工翻译相比，CAT是将手工翻译流程自动化，其翻译质量相同或更好，翻译效率更高。

机器翻译是如何进行的呢???答：机器翻译面临的问题 机器翻译的质量要达到“信、达、雅”的程度依然艰难；机译质量是机译系统成败的关键。中国数学家、语言学家周海中曾在论文《机器翻译五十年》中指出：要提高机译的质量，首先要解决的是语言本身问题而不是程序设计问题；单靠若干程序来做机译系统，肯定是无法提高机译质量的；另外,在...

Translai字幕翻译流程?答：Translai的视频字幕翻译是通过引?AI语?识别和机器翻译将?⌄字幕视频进行听写、打轴和?动翻译，然后通过人工校对确保翻译的准确，再进行字幕压制，还可根据需求对字幕进行个性化设置并输出带字幕的视频后下载。相?传统模式，从流程上来说更加科学。

一文看懂自然语言处理NLP(4个应用+5个难点+6个实现步骤)答：机器翻译 目前的机器翻译准确率已经很高了，大家使用 Google 翻译完全可以看懂文章的大意。传统的人肉翻译未来很可能会失业。NLP 可以使用传统的机器学习方法来处理，也可以使用深度学习的方法来处理。2 种不同的途径也对应着不同的处理步骤。详情如下：方式 1：传统机器学习的 NLP 流程方式 2：深度学习...

小谷智能机器人互动语音怎么是翻译答：翻译机器人的翻译平台GE-CCT 2009通过提供海量词库、支持用户词库、支持交互翻译、术语自动抽取和术语冲突处理等方式解决术语翻译问题。1.第一阶段：从语音信号转化到文本的过程 一般在电销行业中，智能语音机器人会接收到客户说的话语等音频，音频通过语音识别系统进行检测，将其转化为可信息化编辑的二进制...

大家正在搜

翻译怎么应对机器翻译机器翻译是什么机器翻译的过程机器翻译与翻译学机器翻译人工翻译机器翻译和人工翻译对比如今机器翻译代替人工翻译机器翻译的英文机器翻译的不足