第1189章 神奇的中译英
收藏【零一小说www.01xiaoshuo.com】,热门网络小说无弹窗免费阅读!
《饿死鬼情未了》?
王卓有些疑惑地看向余院长。
不是说支持长文或者复杂文本的翻译吗?
怎么还是机翻?
而且机翻这也翻得太离谱了吧?
什么叫做我饿了就为了让你摸一下?
不饿你就不摸了吗?
余凯也有些尴尬了。
这是翻译软件设置的底层逻辑。
面对这种短句,翻译软件只需要动用w的cpU轻量运算,根本不会启动deep的GpU推理。
至于为什么会翻译成“我饿了”?
这可能就是“Ive hungered”这词经常用来形容我早已饥饿的意思。
至少比我渴望已久更常用。
“王总,或许把整篇歌词输入进去,翻译出来的效果会不一样?”
余凯见老板还在等自己回答,小声解释道。
王卓闻言,对着一旁的顾子歆示意,让她来输入。
随着整段歌词输入,演示厅内的寂静终于有了些许的躁动。
特别是负责文本翻译调教的团队,此时表情尤为紧张。
很快,歌词输入完成了,当点击翻译开始,
已经有人开始双手合十祈求别再出现离谱的翻译了。
“oh,my love”
“啊!我的挚爱”
“my darling”
“我亲爱的”
“Ive hungered for your touch”
“我满心期盼与你相拥”
“A long,Lonely time”
“在悠悠孤寂的岁月”
“And time goes by so slowly”
“时光荏苒”
“And time can do so much”
“而岁月无所不能”
“Are you still mine”
“你是否依旧心属于我?”
“I need your love”
“我渴望你的爱”
“I need your love”
“我渴望你的爱”
“God speed your love to me”
“愿你的爱早日降临我的身边”
......
虽然整体上还是有些前言不搭后语,但从翻译的句子来看,至少是有那么一丝美感的。
王卓对此还算是满意。
因为这段翻译并没有遵循单词的直译。
比如“Ive hungered for your touch”这句。
正常翻译应该是“我渴望你的触摸”或者“我渴望触摸到你”,但课程表的在线翻译则是直接翻译成了“我满心与你相拥”。
这说明了余院长所介绍的深度思考是有效的。
因为它是真的有结合前后文的意思在翻译。
当然了,可能还是有些放飞自我。
比如那句“And time goes by so slowly”翻译成“时光荏苒”。
意思没有问题,简洁明了。
可作为歌词是不是可以更加直白一些?
可不可以翻译成“时光缓缓流逝”?
这样会不会更一目了然?
因为单词可以直接对应上。
“专业合同也能翻译?”
“可以,但很吃算力”
余凯回道。
“示范一下”
王卓见状,再次对着顾子歆点了点头。
很快一份网上搜到的合同样本经过现场填写,输入进了翻译软件。
合同页数不多,大概也就十几页的样子,差不多30多秒左右,很快译文便出现了。
对比了一下英文原版,又看了看翻译成中文的合同。
这是一份并购合同,专业术语没有问题,基本上都正确了。
但条款语义需要人工修改,至少王卓已经发现了几个关于赔偿、责任的划分不够清晰。
另外还有刚才顾子歆填写的内容翻译的不够准确,特别是因不可抗力引起的直接损失与间接损失出现了张冠李戴。
“百度他们的长文翻译怎么样?”
“他们目前只能统计机器翻译(Smt),但百度内部也在进行神经机器翻译(Nmt)的测试,包括谷歌以及科大讯飞等其它公司都有类似的项目在推进”
“不过我估计我们的翻译水平应该处于全球第一梯队,毕竟我们不单纯是基于Nmt路径研发,而是采取了统计机器翻译与神经机器翻译结合模式”
余凯回道。
“据我所知,百度那边可能还在考虑如何用Nmt代替原先的统计机器翻译,等他们摸索出单纯Nmt会消耗大量算力后,可能就会转向两者相结合模式”
“但这需要时间”
“那我们是直接跳过了这个过程了嘛?”
王卓问道。
“也不是,之前我们在推荐算法上是有相关的研发,特别是通过cUdA大赛进来的研究员,他们习惯用GpU解决问题”
余凯笑着摇头解释道。
“在关于Nmt的论文发表后,我们直接就启动了关于Nmt路径的研发”
“通过神经机器翻译确实要比统计机器翻译要精准得多,但一些短句、单词也用Nmt就有些不适合了”
“因为我们完全可以提前储备相关高频词汇,不需要每次都调用GpU的算力,所以最后决定采取w+deep模式”
“也就是统计机器翻译负责在词库里翻找常用短句或单词,而涉及到了长文则使用deep调用GpU的算力来进行深度翻译”
“这样一来,我们既节省了GpU的算力,又能够提供多样的翻译服务”
“当然了,目前的调校还是有点问题的,特别是长句与短句的识别问题”
“我懂”
《饿死鬼情未了》嘛!!!
王卓点点头,随即又问道。
“那中译英呢?课程表对于中译文还是有很大的需求的,特别是毕业论文这款,可能相比英译中,中译英的需求会更大”
“可以试一下,但中译英的效果没有英译中好”
余凯在演示之前,提醒了一句。
王卓闻言,轻轻颔首。
这个他能理解。
中文博大精深,不是简单的根据因词翻译就行。
不过理解归理解,当他看到“人山人海”翻译成了“people mountain people sea”后,大脑还是有那么一瞬的宕机。
还真是字面翻译啊!!!
“甲方承担全部物流费用”翻成了“A party bear all send goods money”(一方承担全部货款)
“逾期支付违约金”翻成了“over time must lose money pay money”(随着时间的推移,必须赔钱、付钱)
这中译英不是效果不如英译中,这tm的就是完全就不能用啊!!!
《饿死鬼情未了》?
王卓有些疑惑地看向余院长。
不是说支持长文或者复杂文本的翻译吗?
怎么还是机翻?
而且机翻这也翻得太离谱了吧?
什么叫做我饿了就为了让你摸一下?
不饿你就不摸了吗?
余凯也有些尴尬了。
这是翻译软件设置的底层逻辑。
面对这种短句,翻译软件只需要动用w的cpU轻量运算,根本不会启动deep的GpU推理。
至于为什么会翻译成“我饿了”?
这可能就是“Ive hungered”这词经常用来形容我早已饥饿的意思。
至少比我渴望已久更常用。
“王总,或许把整篇歌词输入进去,翻译出来的效果会不一样?”
余凯见老板还在等自己回答,小声解释道。
王卓闻言,对着一旁的顾子歆示意,让她来输入。
随着整段歌词输入,演示厅内的寂静终于有了些许的躁动。
特别是负责文本翻译调教的团队,此时表情尤为紧张。
很快,歌词输入完成了,当点击翻译开始,
已经有人开始双手合十祈求别再出现离谱的翻译了。
“oh,my love”
“啊!我的挚爱”
“my darling”
“我亲爱的”
“Ive hungered for your touch”
“我满心期盼与你相拥”
“A long,Lonely time”
“在悠悠孤寂的岁月”
“And time goes by so slowly”
“时光荏苒”
“And time can do so much”
“而岁月无所不能”
“Are you still mine”
“你是否依旧心属于我?”
“I need your love”
“我渴望你的爱”
“I need your love”
“我渴望你的爱”
“God speed your love to me”
“愿你的爱早日降临我的身边”
......
虽然整体上还是有些前言不搭后语,但从翻译的句子来看,至少是有那么一丝美感的。
王卓对此还算是满意。
因为这段翻译并没有遵循单词的直译。
比如“Ive hungered for your touch”这句。
正常翻译应该是“我渴望你的触摸”或者“我渴望触摸到你”,但课程表的在线翻译则是直接翻译成了“我满心与你相拥”。
这说明了余院长所介绍的深度思考是有效的。
因为它是真的有结合前后文的意思在翻译。
当然了,可能还是有些放飞自我。
比如那句“And time goes by so slowly”翻译成“时光荏苒”。
意思没有问题,简洁明了。
可作为歌词是不是可以更加直白一些?
可不可以翻译成“时光缓缓流逝”?
这样会不会更一目了然?
因为单词可以直接对应上。
“专业合同也能翻译?”
“可以,但很吃算力”
余凯回道。
“示范一下”
王卓见状,再次对着顾子歆点了点头。
很快一份网上搜到的合同样本经过现场填写,输入进了翻译软件。
合同页数不多,大概也就十几页的样子,差不多30多秒左右,很快译文便出现了。
对比了一下英文原版,又看了看翻译成中文的合同。
这是一份并购合同,专业术语没有问题,基本上都正确了。
但条款语义需要人工修改,至少王卓已经发现了几个关于赔偿、责任的划分不够清晰。
另外还有刚才顾子歆填写的内容翻译的不够准确,特别是因不可抗力引起的直接损失与间接损失出现了张冠李戴。
“百度他们的长文翻译怎么样?”
“他们目前只能统计机器翻译(Smt),但百度内部也在进行神经机器翻译(Nmt)的测试,包括谷歌以及科大讯飞等其它公司都有类似的项目在推进”
“不过我估计我们的翻译水平应该处于全球第一梯队,毕竟我们不单纯是基于Nmt路径研发,而是采取了统计机器翻译与神经机器翻译结合模式”
余凯回道。
“据我所知,百度那边可能还在考虑如何用Nmt代替原先的统计机器翻译,等他们摸索出单纯Nmt会消耗大量算力后,可能就会转向两者相结合模式”
“但这需要时间”
“那我们是直接跳过了这个过程了嘛?”
王卓问道。
“也不是,之前我们在推荐算法上是有相关的研发,特别是通过cUdA大赛进来的研究员,他们习惯用GpU解决问题”
余凯笑着摇头解释道。
“在关于Nmt的论文发表后,我们直接就启动了关于Nmt路径的研发”
“通过神经机器翻译确实要比统计机器翻译要精准得多,但一些短句、单词也用Nmt就有些不适合了”
“因为我们完全可以提前储备相关高频词汇,不需要每次都调用GpU的算力,所以最后决定采取w+deep模式”
“也就是统计机器翻译负责在词库里翻找常用短句或单词,而涉及到了长文则使用deep调用GpU的算力来进行深度翻译”
“这样一来,我们既节省了GpU的算力,又能够提供多样的翻译服务”
“当然了,目前的调校还是有点问题的,特别是长句与短句的识别问题”
“我懂”
《饿死鬼情未了》嘛!!!
王卓点点头,随即又问道。
“那中译英呢?课程表对于中译文还是有很大的需求的,特别是毕业论文这款,可能相比英译中,中译英的需求会更大”
“可以试一下,但中译英的效果没有英译中好”
余凯在演示之前,提醒了一句。
王卓闻言,轻轻颔首。
这个他能理解。
中文博大精深,不是简单的根据因词翻译就行。
不过理解归理解,当他看到“人山人海”翻译成了“people mountain people sea”后,大脑还是有那么一瞬的宕机。
还真是字面翻译啊!!!
“甲方承担全部物流费用”翻成了“A party bear all send goods money”(一方承担全部货款)
“逾期支付违约金”翻成了“over time must lose money pay money”(随着时间的推移,必须赔钱、付钱)
这中译英不是效果不如英译中,这tm的就是完全就不能用啊!!!