原创 国际最新研发澳门特马2020开奖结果一种人工智能模型 能即时翻译101种语言
中新网北京1月16日电 (记者 孙自法)国际知名学术期刊《自然》最新发表一篇人工智能研究论文称,研究人员研发出一个人工智能(AI)模型,能即时翻译多达101种语言的语音和文本,包括直接语音到语音翻译。
这款名为SEAMLESSM4T的人工智能模型,填补了语言覆盖方面的空白,并且性能优于现有的系统。研究团队说,本项研究工作或可为快速通用翻译铺平道路,其资源公开可用(用于非商业用途),以协助进一步研究包容性语音翻译技术。
该论文介绍,科幻小说的读者可能很熟悉《银河系漫游指南》里的“巴别鱼”,这种小鱼能侵入耳朵,即时将一种口语翻译成另一种口语。类似“巴别鱼”的这种工具对于促成全球互联环境下的交流非常有用,但大多数现有的机器学习翻译系统都是文本导向,或者需要语音识别、翻译成文本、再将文本转换成语音好几步。此外,现有语音到语音模型的语言覆盖范围也远低于文本到文本的模型,并且倾向于从源语言翻译成英语,而非从英语到另一种语言。
为了解决这些限制,在本项研究中,美国Meta基础人工智能研究的“无缝交流团队”开发出一个单一模型SEAMLESSM4T,其支持多达101种语言之间的多种翻译模式,可以支持语音到语音(识别101种语言并翻译为36种语言)、语音到文本(101种语言译为96种)、文本到语音(96种语言译为36种)、文本到文本(96种语言)的翻译,以及自动语音识别(96种语言)。
研究团队表示,在语音到语音的翻译中,SEAMLESSM4T的文本翻译比现有系统准确率提升23%。同时,该人工智能模型可过滤背景噪音并适应说话者的差异。
《自然》同期发表同行专家的“新闻与观点”文章指出,虽然后续还需要进一步优化,但人工智能模型SEAMLESSM4T可能代表着向跨越语言障碍促进交流的进步。(完)
中国工程院院士邬贺铨2023年4月曾对中新经纬表示,尽管中国5G建设成绩显著,但在应用层面,5G仍稍显不足。比如,5G虽可支持4K视频,但手机屏幕太小,难以体验2K/4K分辨率的差异;由于车联网和XR(扩展现实,Extended reality)尚不成熟,其他消费领域还难以感受低时延的优点;对于中速与大连接IoT应用,目前5G成本还偏高;现有5G在工业互联网领域应用的能力仍有不足。
本年度入选项目的研究成果具有原创性突出、社会意义重大的特点。其中,“核孔复合体成熟度调控合子基因组激活”的研究,解决了发育生物学领域的重大科学问题;“植物远缘杂交过程中‘花粉蒙导效应’的分子机制”的研究为未来实现植物远缘杂交、创制全新的植物种质资源奠定了坚实的基础;“肠道菌源宿主同工酶是调控代谢性疾病的新靶点”的研究,实现肠道菌群的精准调控,开辟了疾病预防、诊断、干预新路径;“人体器官芯片及多模态精准测量方法构建”的研究在药物研发和筛选、个性化医疗、环境评估、航空医学等领域有着十分广泛的应用。入选项目都是面向生命科学前沿,面向人民生命健康,聚焦解决热点问题。
在精心组织实施空间站应用与发展阶段各项任务的同时,瞄准2030年前实现中国人首次登陆月球的目标,2024年载人月球探测工程登月阶段任务各项研制建设工作也将加紧推进。目前,长征十号运载火箭、梦舟载人飞船、揽月月面着陆器、登月服等主要飞行产品全面进入初样研制阶段,文昌发射场配套登月任务的各项测试发射设施设备也将全面启动建设,各系统相关研制建设工作正在按计划推进。