谷歌实时翻译耳机将淘汰少数民族语言

发布时间:2018-10-09 02:33:16

谷歌实时翻译耳机将淘汰少数民族语言

今年最潮的产品,也是对人类交流方式影响最深远的产品,可能就是实时翻译的蓝牙耳机了。

Google 的Pixel Buds 蓝牙耳机,最吸睛的功能就是结合自家 Google 翻译,可支持 40 种语言实时翻译的功能。

韩国最大搜索引擎 NAVER 旗下的通讯软件 LINE 也推出 MARS 翻译耳机,对话的两个人各自使用一个耳塞,就能立即从耳机中听到翻译的语音,背后同样是仰仗自家的 AI 平台 Clova 及 Papago 即时翻译服务,目前可支持 10 种语言。

(LINE 的 MARS 翻译耳机获得 CES 2018 最佳创新奖。)另外英国的 Mymanu Clik 耳机也可支持 37 种语言即时翻译。

这些强调利用 AI 技术的实时翻译耳机有三大核心模块:语音识别+机器翻译+语音合成。

整个流程就是:第一步,耳机听到对方讲话的内容,识别出这是什么语言如英文、西班牙文等,并且把语音变成文字;第二步,以翻译引擎进行文字对文字的翻译;第三步,就是把翻译结果做语音合成,播放出来。这是集合了听写员、翻译员、朗读员三个角色于一身,科技真伟大!

自从2016 年下半年,Google 宣布转向采用类神经机器翻译(NMT),也就是深度学习神经网络模型之后,以多层次的神经网络连结原文与译文,输出的字词顾虑到全句文脉,同时,也使用了大量 Google 自家开发的 TPU 来处理复杂运算,大大提升了翻译的水平。

NMT 最大的突破就是它的运作方式类似于大脑,将一整个文句视为是一个翻译单元(unit),而非将文句切成好几块,这有两个优点,一是减少工程设计的选择,二是可依据上下文判断,提升翻译的正确性及流畅性,听起来会更自然。

此后,NMT 成为了新一代机器翻译的主流,几乎所有公司都转向 NMT,采用这种技术的服务在 2016 年下半年开始大量问世,Facebook 在今年 5 月也宣布将翻译模型从 PBMT 转向了 NMT。

但是,实时翻译耳机的实际应用仍无法满足所有人。Google 的Pixel Buds 其翻译功能只限于 Pixel 2 手机使用,而且要一句一句说,还无法提供连续性的翻译,例如当你想要用它来看外国电影,这个方法就行不通。

不过,有专家预言,以目前人工智能翻译的进化速度,大概再有三年,机器翻译就可以达到人类翻译的水准了。

人工智能翻译在教育、旅游、社交、跨境交易等领域将有非常大的应用空间;更加颠覆性的变化,或许将发生在不同国家、民族的人,生活的连结方式上。

那么,在未来,人类的语言会是增加,还是减少呢?是不是有了这个翻译功能,各个使用小语种的族群,再也不用费力气学英语、汉语了,小语种会成为非物质文化遗产,不但可以保留,还能发扬光大呢?

您真的想多了。

在高铁修建的时候,人们欢呼,千里江陵0.1日还,速度战胜了距离,终于可以“去中心化”,逃离雾霾的一线城市,到空气香甜的小城镇安家落户发展了!然而,等高铁修好之后,人们失望的发现,交通的便利,加速了周边、乃至更大范围之内的人口加速向一线城市的聚集:人们原先打工去县城,现在一步到位,直接去一线城市挣更多的钱了;原先北京人到石家庄出差,还会住一宿为石家庄创造点GDP,现在则是办完事坐上高铁就回北京了,挥挥手,不带走一片云彩,当然,也不会留下一个铜板。

语言也是一样的道理。

人工智能翻译实用化,突破口会是口译行业,而非笔译。口译对反应速度要求很高,相应地可以牺牲一点儿准确性。一般来说,同传要求准确翻译 80%就能及格,交传要求译出 90%,而笔译要求 100%;机器在反应速度上远超过人类,但处理长句子、复杂语法和文学语言的能力目前还远不如人类,不能准确无误的精准表达内涵。

也就是说,未来的书籍、文章、网页、店面招牌等等,商家出于成本和利润的考量,都还会是大语种的天下,做“最大公约数”;而各民族的口语交流,实时翻译耳机各种场景的实时双语教学,会大大降低小语种使用者学习大语种的难度,高频应用的大语种会最终吞噬掉低频应用的小语种。

在中国,汉族占将近90%的情况下,各民族如果是混合居住,将会是普通话最终一统天下,形成书同文、语同声的局面;各种地方的方言,比如粤语、吴语、闽南话、川语、晋语,也会逐渐向普通话上靠拢。

语言文字单一,不但可以大大降低国民的交流成本,而且可以大大提升自己的职场实力:把多学习一门不必要的语言(少数民族语言、区域性地方方言)的时间节省出来,学习英语,尤其是科技英语。毕竟英语是全世界使用范围最广的语言,也是大多数科技文献的官方语言。

这就是趋势。即使还没有到实时智能翻译时代,这种趋势就已经很明显了。

内地有130多种语言,当中除了一些过百万人口使用的语言外,大部分语言都正走向濒危,有7种语言更只余下不足100人使用。

中国社科院汉藏语专家孙宏开进行了多年的语言调查,他发现全国只有不足100人使用的语言有7种,100至1000人使用的有15种。有些语言如:羿语、木佬语、哈卡斯语都已经消失。

孙宏开举阿龙语为例,阿龙语是怒族其中一个支系'阿龙'所说的语言,他去调查时发现只余下100名老人能说阿龙语,年轻人已经不说了。情况类似的语言在国内还有十多种。

孙宏开指出,民族人口少是令语言面临濒危的原因之一;另外,很多少数民族选择走出去,走出去的人更难保持母语,城市对年轻人有很大冲击,年轻人到过城市后就觉得自己民族的语言很土,不愿再说;媒体的发达也是小语种面临濒危的原因,'随着广播、电视、网络的传播,自然而然就习得了汉语'。

国内学者戴庆厦、包冬梅、哈斯额尔顿、王远新,对云南、内蒙古、北京等地的蒙古族语言使用状况做了相关调查,研究结果表明:大多数地区在强势汉语的影响下尚能保存母语的使用,但是,蒙古族青少年的母语能力出现了不同程度的下降,母语传承出现了代际差异。

学者韩建岗对新疆仅有的两个蒙古自治州之一,巴音郭楞蒙古自治州(巴州)的首府库尔勒市的蒙古族语言使用情况做了分析研究。蒙古语、汉语、维吾尔语是巴州的三种通用语。巴州蒙古族中学和巴州蒙古族小学(均在库尔勒市)开设蒙语言班、蒙汉双语班和汉语班。根据《巴音郭楞统计年鉴——2014年》,2013年末,库尔勒市总人口56万余人。其中蒙古族5689人。

调查数据显示:93.8%的人从小习得了蒙古语,4.1%的人从小习得了汉语,仅有2.1%的人同时习得了蒙汉双语,绝大多数城市蒙古族家庭仍以蒙古语为主,汉语为辅;53.4%的人可以用蒙汉维多语与人交谈,40.9%的人可以用蒙汉双语与人交谈,仅5.7%的人只掌握单语(蒙古语或汉语),说明巴州蒙古族被社会氛围影响,双语人较为普遍。 (韩先生调研的巴州牧区)

内蒙古自治区,则是牧区教育城镇化后,牧民子女享受着楼房化的教室宿舍、美丽宽敞的校园、现代化的教学设备、学校全部寄宿制,强有力的现代文明和现代教育实际上已经不知不觉地把他们的民族文化挤到边缘上去了。牧区孩子逐渐失去民族语言文化的环境,以前的孩子们认为“汉语难学”,现在的孩子们感到“蒙语难学”。

语言文字的书同文、语同声,就是在“润物细无声”中默默到来的。可惜,国内很多人、很多地方政府、甚至国家层面,都没有认识到这个趋势,还在逆潮流而动,花钱受累,做着各种无用功。2005年5月31日起施行的国务院令第435号,国务院实施《中华人民共和国民族区域自治法》若干规定中,有如下规定:

第二十二条 国家鼓励民族自治地方逐步推行少数民族语文和汉语文授课的“双语教学”,扶持少数民族语文和汉语文教材的研究、开发、编译和出版,支持建立和健全少数民族教材的编译和审查机构,帮助培养通晓少数民族语文和汉语文的教师。

第二十四条 国家支持少数民族新闻出版事业发展,做好少数民族语言广播、电影、电视节目的译制、制作和播映,扶持少数民族语言文字出版物的翻译、出版。

2015年,内地启动了语言资源保护工程,每种语言记录3000个常用词、100个句子和400分钟的文化典藏,现时已完成81个少数民族语言、53个汉语方言和32个语言文化的调查。

内蒙古自治区明确提出,把学习掌握母语作为基本要求,把学习运用汉语作为基本素质,推动少数民族学生增强对双语学习的重视程度。自治区人大审议通过《蒙古语言文字工作条例》,使蒙古语言文字得到传承和保护,双语人才数量显著增加;制订《自治区民族教育条例》,促进自治区民族教育发展。以法制化的要求,构建起从学前、中小学到高等学校,各阶段有效衔接的双语教育体系。

内蒙古师范大学教授吴海山介绍,65年累计编译的蒙古文教材达963部,形成学科门类完整的蒙古文教材体系。到2016年,全区有独立设置的民族中小学校502所,在校学生36万多人,其中实行双语教学的有22万人,普通高校53所,其中24所开设了104个蒙汉双语授课专业和少数民族预科班,在读学生3.3万人。

从2011年开始,全区所有双语教学中小学生率先享受到“12年免费教育”政策,很多盟市将实现蒙古语授课学生15年免费教育。

这么多蒙语学生,有好的就业出路吗?很残酷,市场真的不需要。不过,别愁,借问酒家何处有,牧童遥指杏花村……有万能的政府托底呢。内蒙古2015年规定在公务员考录、事业单位公开招聘时,要划出不低于15%的职位(岗位),定向招录蒙古语授课毕业生;蒙古族和“三少”民族聚居旗县及以下事业单位可根据实际,提高录用(招聘)比例。

很有爱的做法,其实很有害。这不是在爱他们,而是在害他们。毁掉他们的职业竞争力,毁掉他们的未来。

民族教育在城镇化过程中,教育目标的设计是以城市化、现代化为导向的,民族学生的教育是以融入城镇为目标的。而城市化人才的培养,需要均质化的教育。现代世界上任何多民族国家都把'公民意识'和'国家意识'的树立和加强放在学校教育的核心地位。

少数民族语文教材课文内容和汉语语文教材内容,根本就是不一样的,少数民族语文教材选择的课文都是该民族历史上的文学篇目、历史上的文学家、以及该民族现当代民族语作家的文章。这种语文教材,是不利于真正的中华文化共同体建设的。如果我们的教材、中小学教育处理不当,在少年、青年一代中造成'本民族意识'与'国家意识'相互矛盾乃至对立的认识,可能给国家未来、特别是边疆民族地区的长治久安带来隐患。

少数民族语言的数理化教材,更加不利于学习成绩的提高。众所周知,现在拼成绩,要靠补课,要靠辅导书,甚至要靠网络教学,这些差异化服务都是大语种才有的。小语种很吃亏。

(蒙古语计算机教材)在科技日新月异的时代,各位领导,思路真的要变一变了。当然,我知道,事情不会那么容易的;少民文字文学和教育,又是一个既得利益集团。

不过,总归还是有一点好消息:新疆几十万本维语中小学教材被停用;博尔塔拉州蒙古语教学也被停止。希望,这仅仅是开始。

真想说一句,剪掉辫子吧,大清已经亡了!

谷歌实时翻译耳机将淘汰少数民族语言

相关推荐