同声字幕,覆盖近200国,无惧离线——讯飞翻译机3.0,值得拥有的居家学习、境外商谈旅行神器
英语直播、生肉追剧看不懂?
出国旅行、购物、生活语言不通?
涉外商务谈判想用外文沟通但心有余而力不足?
兴致勃勃地参加国际学术会议却只能和几个中国人扎堆儿交流?
费劲周章海淘海购回来的商品看不懂说明书和用法?
……
现在我们和世界的互联互通愈加频繁,随之而来的语言不通问题引起的尴尬和不便也越来越多。而即便如LZ基本能进行英语的书写和听说,但即便是世界最流行的英语在很多国家的普及率也并不高(即使是比较发达的德国、法国等),或是英语沟通时有口音存在(例如印度英语、日本英语)的情况下,在旅行、会议时与当地人沟通,依然存在着巨大的语言障碍——这时所需要的,就是一款全能的翻译机设备。
目前市面翻译机产品有很多,其中讯飞翻译机3.0是由科大讯飞股份有限公司(以下简称“科大讯飞”)在2019年5月推出的最新AI翻译产品,集合了神经网络机器翻译(NMT)、语音识别、方言识别、语义理解、语音合成、文字扫描识别、离线翻译、四麦克风阵列、远距离拾音及智能降噪等多项全球先进的技术。
今天就让LZ带大家来体验一下这款功能强大而又全面的翻译机产品,here we go
一、关于讯飞 — iFLYTEK
科大讯飞(IFLYTEK)成立于1999年,是一家专业从事智能语音及语言识别翻译技术研究、软件及硬件产品的企业,旗下消费级语音产品包括耳熟能详的讯飞输入法、灵犀语音助手、讯飞听见智能会议系统、讯飞翻译机、阿尔法蛋等好评如潮的产品。
2017年6月,在《麻省理工科技评论》(《MIT Technology Review》)评选的“2017年度全球50大最聪明公司”(“50 Smartest Companies 2017”)榜单上,科大讯飞位列全球第六位,并且被冠以“该公司旗下的语音助理技术是中国版的Siri”的高度评价。
科大讯飞的语音识别、转换和翻译技术经过多年的市场考验,作为很多国际大型会议、赛事的官方语言处理相关业务的供应商,已经得到了用户的广泛认可
具体到这款讯飞翻译机3.0,主要具备了以上多语言翻译、离线翻译(绿色填充内容)、方言翻译、拍照翻译、行业A.I.翻译、口语练习等几大功能,以及隐藏的黑科技——同声字幕。
只需要一机在手,就可以覆盖大多数商务会谈、境外生活旅行、英语学习等的需求,说是一机多能丝毫不为过。
二、开箱
讯飞翻译机3.0包括翻译机主机、收纳皮套、Type-C数据线以及充电头。采用了目前主流的Type-C接口充电,充电器规格是5V/2A,出门可以和其他数码设备共用充电装备,这点非常方便。
讯飞翻译机3.0有墨研黑、星空蓝、宝石红三种配色,LZ到手的是墨研黑。操作方面,讯飞翻译机3.0采用了触屏加物理按键的方式,操作比较直观,而且修长的线条握感也很好。
机身尺寸为145*52.6*12.5mm,重量为130g,纤长轻盈的机身可以比较轻松地收纳到包内的每个角落。
讯飞翻译机3.0配置了骁龙8核处理器,操作系统是基于安卓8优化开发的。3.1英寸触摸屏中央显示时间和日期,屏幕下方有三枚功能按键,另有下拉菜单包含WiFi、数据、蓝牙和亮度调节四个快捷功能。
红蓝按键分别对应中文和外文语音输入,需要将中文翻译成外文时按住红键输入,反之则按住蓝键,即可实现中文与数十种外文的语音互译;红蓝按键中央则是返回键,可以返回上一步的界面。
正面按键尺寸可以参照一元硬币,宽大的按键按压起来也比较轻松,并且可以方便地做到需要翻译时即时盲按,不错过重要事项。
主界面左右各有一屏,左1屏按顺序显示着语音翻译历史,右1屏是功能界面,包括拍照翻译、同声字幕、个人中心、口语学习、全球上网、SOS以及设置。
机身背部是聚碳酸酯材质,分列着闪光灯、摄像头和扬声器,实际使用中闪光灯保证了暗光下的清晰拍照识图,而正反两个扬声器足够大的音量也保证了翻译播报可以准确收听。
机身右侧有电源键和音量键,左侧则是Nano SIM卡槽,四个角分布着天线切口。
上下边框角落分布着4个降噪麦克风,大大的保证了音频的清晰采集,毕竟收音质量关乎着识别和翻译的准确性。
讯飞翻译机3.0有5种上网方式,既可以通过WIFI联网,也可以插入SIM卡联网,还可以通过机内购买全球上网流量卡(虚拟卡)来联网,另外还具有蓝牙共享和给其他设备开启热点的功能。
通常旅行在外都会带插着流量数据卡的手机或是随身WiFi,这时给讯飞翻译机3.0开个热点连接即可。
其实翻译机本身就可以实现随身WiFi的功能,插入SIM后不仅自己可以上网,还可以给手机、平板、笔电等其他设备开热点。翻译机这点功能还是很实用方便的,毕竟出门在外东西只多不少,能少带一件是一件。
翻译机内可以直接购买100+国家和地区的虚拟流量卡,价位大多都在18-22元之间,价格不贵,胜在方便,毕竟旅行、商谈需要发邮件、视频之时,能够方便购买流量就解了燃眉之急了。
考虑到使用对象和海外场景中可能发生的突发事件,讯飞翻译机3.0还配备了SOS紧急联络功能,可以在危机情况下连续按电源键3次,快捷地向预设紧急联系人发送短信。
续航方面,讯飞翻译机3.0采用了2500mAh电池,考虑到讯飞翻译机3.0功能专注翻译这的使用情况,续航时间还是可以充分保证的;不过要是还兼做随身WiFi的话,建议再搭配充电宝一起使用。
三、同声字幕
经常会有想看一些电影、剧集、长短英文视频但又没有字幕的情况,比如正在直播的英文发布会、提前发布的剧集生肉、油管上的歪果仁自摄视频、没有字幕组翻译的小众剧集/综艺……对于英语听力还不错的人可以当成是练习英语的好机会,但如果听力水平一般或是完全不懂英语,又很想看视频内容,那就完全是煎熬了。
针对这种需求,讯飞翻译机3.0推出了黑科技级别的“同声字幕”功能。
简单地说,就是通过将翻译机与PC连接,就可以将PC正在播放的视频中的英文(中文),同步翻译成中文(英文)并将双语字幕即时显示在PC屏幕上。
字幕显示区域是一个和屏幕等宽的长条区域(默认位于上图中白线下方区域),可以任意拖动及调节透明度,字幕的字体也可以调节大小并加粗。
根据使用场景不同,“同声字幕”分为“倾听模式”和“对话模式”两种模式:“倾听模式”可以收听PC播放内容,并进行实时翻译;“对话模式”则既收听PC播放内容,又同时收听使用者的话音,并同时对两者的内容进行翻译。
以下是“同声字幕”的两段体验:
第一段视频是艾玛·沃特森在联合国大会上关于“针对女性的校园暴力”的一段演说(视频地址):
艾玛·沃特森操着一口正宗的英式英语,再加上是在正式场合的演讲,语法比较规范,因此讯飞翻译机3.0的“同声字幕”效果非常好。
下面这个视频是拿同声字幕在两段视频的体验,分别是吴恩达(Andrew Ng)在斯坦福的深度学习课程(视频地址)和苹果2019年秋季的发布会(视频地址):
Andrew的视频有一定背景噪声,而且“Um”着实有点多,不过讯飞翻译机3.0都较好地克服了,而且大部分关于课程内容的翻译都是很准确的;苹果发布会的音频质量较高,几位演讲者一口流利的美音也很标准,除了个别演讲者“吞音”引起的“误听”外,基本规范地翻译出了演讲内容。
目前“同声字幕”功能支持中英在线互译,全面覆盖了远程会议、个人学习及娱乐、两大场景。期待未来能够支持日语、法语等更多语种,使用场景将更为广阔。
四、多语种翻译
从讯飞翻译机3.0支持的语种来看,包含中英、中法、中西、中葡、中俄、中日等主流语种,可即时翻译语种覆盖了全球近200个国家和地区,可以满足几乎所有人的任何境外旅行外文沟通需求了。
体验即时翻译的功能时,LZ“精分”了一把分饰二角,实际体验来看不仅翻译速度飞快,骁龙八核处理器加持下可以做到0.5秒闪译,而且中英在线翻译准确率也很高,标称的98%准确率妥妥的,与专八水平相比不遑多让,让不懂英文的人也可以做到即时的外文对话。
看到视频最后的值友会发现一枚LZ特意给中文部分加上字幕的“彩蛋”:“A million thanks!”被译成了“一百万。谢谢!”——LZ以前的老板如果是有事拜托的话,邮件最后都会跟一句“A million thanks!”。LZ就当这是从“many”到“a million”的数量上夸张的变种用法,然后也慢慢习惯这么用,其实规范的用法应该是“Thanks a million”或是“Many thanks”。如果是规范语法输入的话讯飞翻译机3.0正确翻译完全没问题,要求机器对不规范的语法进行正确翻译,就有点强“机”所难~
LZ找来了这两天新鲜热乎的新闻(给北京科技大学巴基斯坦留学生回信,英文新闻链接)读给翻译机来翻译,上图左边是新闻全文以及红框圈中的LZ阅读部分,右边是翻译机收音之后的翻译结果。
选中这三段也是基于了下面这些考量:
第一段中有新鲜词汇COVID-19,可以看到翻译机虽然没有明确翻译成“新冠肺炎”等名词,但直译成字面意思而且还没有丢掉“-”也是非常准确了。其实在音转字的过程中,能够不丢符号也是很重要而且很难的。
第二段开头就有一句俗语,翻译机能信达雅地翻译成“患难见真情”也是不错;
第三段则包含了“the Belt and Road”这一专有名词,当然这种固定用语的翻译其实对机器来说是最容易的了。
这个视频里LZ选取了前面新闻中的一段话,尽管是复合结构的句子,但最终仍然能够按句子语义结构有序翻译,翻译结果精准;语速特意稍微快了一些,从翻译机显示的译文来看与LZ读出的新闻分毫不差,仍然可以轻松准确识别,给准确翻译打下了重要的基础
搜索视频时找到外交部长王毅的一段日语发言(视频链接),不愧是我们北二外毕业的外交部长,语音语调都非常流利,对翻译机来说也可以轻松翻译。
除了多国外语的翻译之外,讯飞翻译机3.0还支持粤语、东北话、河南话、四川话、山东话以及有口音的普通话与英语的直接翻译,以及粤语与普通话的互译:
LZ选了几个语言有代表性的句子,选取各自的方言翻译模式,即便语调各异,也都能准确地识别语音内容并翻译。
另外在LZ刚刚收到的更新提示中,还最新加入了藏语与维吾尔语的离线翻译功能,对涉及新疆、西藏等少数民族地区的工作也是强有力的支持。
根据市场调研,实际接触的使用英语的外国人往往操着各种口音,且说话语速还特别快,听起来很是费劲。而面对带有口音的英语时,常规情况的翻译机也会面临巨大的困难。如何解决口音识别问题,是语音识别翻译的下一个竞争焦点,但这不仅仅是单纯增加语料库就能做到的,而需要根据每种口音的特点,分别构建专门的语音模型,来解决口音问题。
讯飞翻译机3.0通过端到端(seq2seq)语音识别技术(ASR)和神经机器翻译技术(NMT),大幅提升语音识别效果,做到了多种方言口音英语翻译,包括支持英语 (加拿大)、 英语 (英国)、英语 (新西兰) 、英语 (澳大利亚)、 法语 (加拿大)、英语 (印度)、和孟加拉语 (印度)。即便是面对世界上多种口音的英语时,也不用担心再产生“听力障碍”了。
放眼世界英语口音中,吐槽最多的口音里绝对少不了印度英语。印度英语的发音总结一下,就是清辅音会浊化来读,譬如/p/读成/b/,l结尾的卷舌音说出一股羊肉串味儿……虽然英语是印度的官方语言之一,普及率不低,但这也导致印度英语语速不低,再加上受印地语影响,那咖喱味儿可真是够受的了。LZ以前跟一个印度人在一个办公室共事过,足足过了仨月才渐渐适应。
而印度作为计算机、医疗发展水平较高的国家,在全球范围内的印度人也非常多,难免会有要打交道的时候。一时半会儿适应不来怎么办,我们听听讯飞翻译机怎么说:
这是印度街头的一个视频采访(视频链接),主持人本身的英语就有点口音,但问题不大,对于翻译机来说也能比较准确地翻译——后面的采访对象就咖喱味儿泛滥了,对翻译机也造成了不小的挑战——其实在所有口音英语中,印度英语是听起来比较费劲的了,相比之下英国英语、澳洲英语都还要好得多。
其实除了以上国家,还有很多国家也有口音,譬如隔壁的邻居霓虹,就有典型的日式英语发音,一个辅音必须配上一个原因,/η/发成/g/,/r/发成/l/等等:
起初听日本人说英语的话简直就是以为在说日语,掌握规律之后倒也能迅速掌握,而“规律性”对机器来说是最容易理解的事情。讯飞翻译机3.0的口音英语翻译目前还未包括日本英语,期待在完善当前口音翻译的基础上,开拓更多口音外语。
五、离线翻译
与国内相比,国外的网络建设说起来让人一言难尽——城市里的WiFi铺设较广但网速时高时低,数据流量的速度更是随缘,因此如果对翻译机有翻译需求的话,能不能做到离线翻译是翻译机综合实力非常重要的一环。
针对国外网络信号不好这一点,讯飞翻译机通过包含离线语音识别引擎、离线翻译引擎和八核处理器等软硬件,利用更大规模的离线语音识别训练模型,可以做到中英文识别率超95%,达到大学六级水平,并进一步支持中文与日语、韩语、俄语、西班牙语、法语六种语言离线互译,再加上最新新增的藏语、维语与汉语的离线互译,使大多数使用场景下即便没有网络也可以正常使用翻译功能。
LZ使用新闻,选取了其中两段话做翻译测试,可以看到两段都是复合句的情况下,离线翻译也依然准确。
六、拍照翻译
对大多数普通人来说,拍照翻译大概是语音翻译之外最常用的功能了——
看不懂菜单怎么办,拍一下
看不懂路牌怎么办,拍一下
看不懂保健品说明怎么办,拍一下
学习外语过程中遇到不懂的词句怎么办,拍一下
……
讯飞翻译机3.0支持拍照翻译,自动对焦,而且还配有闪光灯,搭配业界顶尖的图文识别(OCR)技术,轻松翻译要查询的内容。目前支持中文与英、日、韩、法、德、俄、泰、西班牙、葡萄牙、意大利、阿拉伯、越南、印尼13种语言的拍照翻译,并支持中英离线拍照互译。
用厨师机说明书里的西班牙语测试了一下拍照翻译,翻译效果满分。看不懂使用说明,用翻译机一拍即可。
这一功能对于在国外买买买时不懂外语的人来说,简直就是扫货神器了。
一直比较敬仰宫崎骏,之前买过一本英文版的《Turning Point》,偶尔会拿出来翻翻练习一下英语。
其中很喜欢背后这段话,偶然间用“中-日”拍照的翻译模式拍下后也准确地翻译成中文了,看来翻译机也有一定的语言识别能力。
书中有一段宫崎骏的手写体,用来测试了一下拍照翻译,每次结果都有些细微的不同,但大面上的意思基本一致,看来拍照翻译对手写体也有相当程度的识别能力。
顺便贴一张手机自带的拍照翻译的结果,由“XX翻译”提供的翻译技术支持,结果惨不忍睹……拍照翻译后的结果可以通过语音播报出来,而且语音风格和语气根据语种不同而不同,相比于常规的机器合成语音,更加贴近说那个语种的人的真实语音——脑补了一下宫崎骏的声音“合成”进去,竟然有些感动……
在日本旅游时冲着封面的《天气之子》买了一本杂志,内容完全看不懂,一直在书柜压箱底……
通过讯飞翻译机3.0的拍照翻译,竖排的日语也基本准确地翻译了出来,日语苦手也可以愉快地看杂志了!
目前讯飞翻译机3.0的拍照翻译基本满足日常使用了,但考虑到拍照翻译的使用场景需求较多而又复杂多变,建议在迭代产品中进一步提升摄像头素质,例如提高像素、增加防抖及多倍变焦,从硬件上来给文字识别技术所需要的数据质量提供有力支撑。
七、行业A.I.翻译
如果不是对经济、金融、时政领域了解的人,大概率会把“the Belt and Road”翻译得莫名其妙吧~
职业英语中很多常用词汇在这里也变成了完全不同的意思,而且通常有很多日常英语不常遇到的艰涩词语(组),甚至行业不同,艰涩词汇也不同,甚至有翻译上的“隔行如隔山”。如果是因为工作出国或者进行外语谈判,可能会遇到专业上的外语和文字,这对很多人就是个不小的考验了,一般的翻译机也只是通用的翻译模式,并不能满足工作专业性的翻译需求。
针对这部分人专业上的更高需求,科大讯飞首创了行业A.I.翻译,通过行业外语翻译数据的积累和行业专家的知识,来让行业领域上的词汇翻译得更准确、专业。
目前讯飞翻译机3.0可以根据需求选择医疗、金融、计算机、体育、外贸、能源、法律、电力八大热门行业,在学术会议、商务交流等专业场合下,也可以翻译各种行业内的专业词汇等等。
“target”通常是“目的、目标”的意思,放在医疗领域的“target organ”就是“靶器官”这一专有名词了;而“bid bond”也是金融行业的专有名字,可以看到讯飞翻译机3.0在例句中准确地翻译出了这些行业名词。
需要注意的是,行业A.I.翻译功能目前只仅支持中英互译,而且需要联网在线使用,不然既不会显示图标,也无法使用这个功能。
八、外语学习
除了专业的翻译功能,讯飞翻译机3.0也是一个学习外语的利器:
利用口语学习功能,可以练习常用的场景英语口语,不再是“哑巴英语”“聋子英语”;
利用语音翻译、拍照翻译等多种途径,可以实现中文与多种语言的随手译,方便即时查询语音语义,并对照播报来跟读练习;
利用翻译记录同步导出,可以重点针对翻译记录中不熟、不懂的内容随时查阅,反复巩固学习。
口语练习
讯飞翻译机自带了丰富且实用的场景来帮助组进行跟读练习,而且还可以智能评分,并对发音不正确的地方进行纠正。
目前讯飞翻译机3.0已包括家人、学校、问候、天气、动物、运动、谈判、电话、出行、购物、饮食、住宿、观光、生活服务、情感、俗语16个场景的海量例句。其中涉及商务谈判、电话交谈等有效助力远程沟通的场景,也有问候用语、生活用语等适合儿童学习跟读的内容。
进入每个场景标签后,可以挑选例句进行跟读,跟读之后系统会智能打分,并指出发音不准确的位置,对口语练习很有帮助——期待未来能有整段的口语练习功能,使口语提升的效果倍增。
拍照翻译学习
在很多领域的科学研究中,我们都还只是跟随者和学习者,研读外文文献是当下的必经之路。而对于本科阶段的学生来说,初读外文文献是件非常痛苦的事情。
那么有没有捷径呢?很遗憾,答案是否定的,点滴积累是必经之路。但是翻译机可以让这个过程不那么痛苦,帮助使用者快速积累词汇,尽快达到外文阅读的更高水平。
Michio Kaku写过很多优秀而又浅显易懂的科普读物,《Physics of the Impossible》就是其中不错的一本,即使是英文版的遣词造句对大多数熟悉英语的人读来也不生涩。试着用拍照翻译功能翻译了其中一段话,即便是结构比较复杂的第二句话,也很好地按照语法结构通顺地翻译了下来。
总体来说,仅靠拍照翻译,也可以满足一个科技专业(并非英语专业)学习者的使用目的。
翻译记录导出
讯飞翻译机3.0通过将设备绑定公众号,可以实现将机内的翻译结果同步到移动端,随时根据需要查看。
同步之后,就可以在公众号中按时间顺序复习查询过的语句,或者重温与商务对象、国外友人的谈话内容,根据使用场景,这一功能也有着广泛而重要的用途。
九、降噪及收音体验
在语音翻译的关键技术中,语音合成和语音识别是比较重要的。语音合成技术,可以让机器说话;而语音识别技术,可以让机器听得懂人说话。而为了让机器听得懂人说话,语音消噪和增强等可以让机器清晰收音的技术就必不可少。
为了让机器“听得更清”,讯飞翻译机3.0上搭载了4麦克风阵列,搭配远距离拾音算法和自主研发的降噪算法,可以实现远距离和噪杂环境下的收音和识别。
LZ在最高档的油烟机(20m³风量)下测试了收音和翻译效果,翻译机距离油烟机和LZ各约20公分,最终效果也是非常令人满意的,甚至连“youth”中的清辅音/θ/都可以识别出来——这样即便是在嘈杂的集市,或是喧嚣的酒吧,收音和翻译也都不会成问题。
另外在室内大音量播放电影的情况下,距离LZ一臂远的翻译机,即便是LZ特意小声说话,也依然顺利收音并准确翻译,足见其收音和降噪的功力了。
十、总结
经过多方面的试用后,LZ彻底体验到了与目前即时翻译软件或是手机自带拍照软件截然不同的体验——复杂环境下可以做到准确收音、支持翻译的语言足以覆盖全球、多个主流语种可以实现离线翻译、越来越多的方言和口音可以互译……
如果早几年用上这款讯飞翻译机3.0,LZ大概就不会在巴黎转机时面对高傲地说着法语的地勤人员一脸无奈,就不会在某东京地铁站对着站务人员说着“Sumimasen, which densha shall we take to Ueno Station?”这种东拼西凑来的奇怪问法,就不会直到报告快结束才明白那位来自日本主讲人反复提到的“怕烫”原来是“pattern”的意思,就不会……
一直以来所说的“科技改变生活”,在LZ看来,讯飞翻译机3.0在当下正在充分地把一项项高科技转化为触手可及的产品,来真真切切地改变着翻译领域的工作、生活、学习等方方面面。
无论是苹果发布会的原生直播,还是热乎乎的美剧生肉;
无论是与大洋彼岸的海外朋友实时沟通,还是与桌对面的境外贸易伙伴进行谈判;
无论是与欧洲小镇集市上的摊主讨价还价,还是与B&B结识的异国友人谈笑风生;
无论是境外扫货,还是宅家学习……
讯飞翻译机3.0,有这一台就够了!
小编注:本文作者@绯村心太 是什么值得买生活家
他的个人自媒体信息为:新浪微博:@_绯村心太_
扶持推广个人品牌是生活家新增福利,更多详细内容请了解生活家页面(https://zhiyou.smzdm.com/author/)。
欢迎大家踊跃申请生活家,生活家中表现优异的用户还将有机会成为『首席生活家』,欢迎有着特别生活经验的值友们踊跃加入生活家大家庭!
菜月昂
校验提示文案
观壑莫文
校验提示文案
面包超人2014
校验提示文案
鄺鄺
校验提示文案
喇叭花
校验提示文案
玲玲静静买
校验提示文案
呆呆呆呆呆呆呆呆呆
校验提示文案
澄韵净空
校验提示文案
狸叔玩数码
校验提示文案
五菱白白子
校验提示文案
一颗稻草
校验提示文案
值友6978310531
校验提示文案
值友6978310531
校验提示文案
喇叭花
校验提示文案
鄺鄺
校验提示文案
澄韵净空
校验提示文案
面包超人2014
校验提示文案
呆呆呆呆呆呆呆呆呆
校验提示文案
一颗稻草
校验提示文案
五菱白白子
校验提示文案
狸叔玩数码
校验提示文案
观壑莫文
校验提示文案
菜月昂
校验提示文案
玲玲静静买
校验提示文案