国际最新研究称,一人工智能模型能翻译200种不同语言

中新网北京6月8日电 (记者 孙自法)国际著名学术期刊《自然》最新一篇人工智能(AI)研究论文称,研究人员开发出一个Meta人工智能模型的底层技术,该模型能翻译200种不同语言,增加了能用机器翻译的语言数量。

该论文介绍,神经机器翻译模型利用人工神经网络翻译各种语言,这些模型通常需要大量可在线获取的数据加以训练,但并非所有语言数据都公开、低成本或是普遍可及,此类语言被称为“低资源语言”。而增加模型在翻译语言数量上的语言输出可能会影响模型的翻译质量。

为此,本篇论文作者、“不落下任何语言”(No Language Left Behind,NLLB)团队开发出一种跨语言技术,能让神经机器翻译模型学习如何利用翻译高资源语言的预存能力来翻译低资源语言。作为成果,NLLB团队开发了一个在线多语言翻译工具,名为NLLB-200,该工具能容纳200种语言,其低资源语言数量是高资源语言的三倍,翻译表现比已有系统高了44%。

由于NLLB团队在许多低资源语言上只能获取1000-2000例样本,为扩大NLLB-200的训练数据量,他们用一个语言识别系统发现了这些特定语言的更多实例。该团队还从互联网存档中挖掘双语文本数据,帮助提升了NLLB-200的翻译质量。

《自然》同期发表同行专家“新闻与观点”文章指出,NLLB团队研发的这个工具,可以帮助很少被翻译的那些语言的使用者,让他们能使用互联网和其他技术。

此外,NLLB团队还强调教育是一个非常重要的应用,因为这个模型可以帮助低资源语言使用者获取更多图书和研究文章。不过,该团队也提醒说,误译的情况仍有可能出现。(完)

【来源:经济界】凡本网注明“来源:经济界” 的所有作品,版权均属于经济界。如转载,须注明“来源:经济界”。违反上述声明者,本网将追究其相关法律责任。
上一篇 2024-06-09 下午7:27
下一篇 2024-06-09 下午7:58

相关推荐

  • 崔天凯寄语毕业生:人工智能是热门,但强大的算力不可能代替独立思考

    7月7日,上海科技大学2024届毕业典礼暨学位授予仪式举行,中国前驻美国大使崔天凯发表特邀主旨演讲。 崔天凯的演讲主题为“迎百年变局、走自强之路”,他结合自己在国外留学,特别是担任驻美大使等经历的深入思考,希望毕业生坚定自信,叮嘱毕业生要学会用科学的世界观和方法论认识世界、认识自己。 崔天凯坦言,现在一些“网红”、“大咖”很有影响,人工智能更是大热门,似乎有…

    2024-07-07
    0
  • “没有演员,均由AI生成”,快手宣布即将上线AIGC短剧

    7月6日,世界人工智能大会(WAIC)期间举行的快手大模型论坛上,快手副总裁、大模型团队负责人张迪宣布,快手首部AIGC原创奇幻短剧《山海奇镜之劈波斩浪》即将上线,可灵为该剧提供深度技术支持。张迪表示,利用AI技术可大幅度提高短剧生产、制作和运营的效率。论坛上也播放了该剧的预告片。 快手大模型团队方面向观察者网透露,该剧由该团队提供深度技术支持,配合创作团队…

    2024-07-07
    0
  • 生成式人工智能,我国遥遥领先了吗?

    近日,世界知识产权组织(WIPO)发布了《生成式人工智能专利态势报告》。报告显示,2014年到2023年,中国生成式人工智能专利申请量超3.8万件,居世界第一位,是第二名美国的6倍。看到这个令人振奋的消息,一些网友把“遥遥领先”打在公屏上。 我们真的遥遥领先了吗?这要从两方面来看。一方面,我们应该自信自强;另一方面,我们不可自傲自满。 生成式人工智能技术(A…

    2024-07-07
    0
  • 圆桌|人工智能创新涌现,学界如何站到最前沿?

    校长激辩AI人才培养 “什么是AGI(通用人工智能)?形象地说,它就像是AI(人工智能)的爱因斯坦。” 7月4日,在2024世界人工智能大会“人工智能:科研范式变革与产业发展”主题论坛上,上海科学智能研究院(以下简称上智院)院长、复旦大学浩清特聘教授漆远谈到了他心目中AGI和AI4S(AI for Science,科学智能)的未来形态。 在大模型如雨后春笋、…

    2024-07-07
    0
  • 新华财经丨2024世界人工智能大会探馆:这些人工智能技术集中亮相

    来源:新华网 新华社上海7月5日电(记者 王淑娟)4日,2024世界人工智能大会在上海开幕,大会深度聚焦人工智能的前沿技术、应用场景与创新生态。今年有哪些“镇馆之宝”?有哪些重磅新品首发首秀?有哪些神奇的“模力”应用落地呢?跟随记者的镜头一起来看看吧! 重播 播放 00:00 / 00:00 直播 00:00 进入全屏 50 点击按住可拖动视频 人工智能正在…

    2024-07-06
    0