国际最新研究称,一人工智能模型能翻译200种不同语言

中新网北京6月8日电 (记者 孙自法)国际著名学术期刊《自然》最新一篇人工智能(AI)研究论文称,研究人员开发出一个Meta人工智能模型的底层技术,该模型能翻译200种不同语言,增加了能用机器翻译的语言数量。

该论文介绍,神经机器翻译模型利用人工神经网络翻译各种语言,这些模型通常需要大量可在线获取的数据加以训练,但并非所有语言数据都公开、低成本或是普遍可及,此类语言被称为“低资源语言”。而增加模型在翻译语言数量上的语言输出可能会影响模型的翻译质量。

为此,本篇论文作者、“不落下任何语言”(No Language Left Behind,NLLB)团队开发出一种跨语言技术,能让神经机器翻译模型学习如何利用翻译高资源语言的预存能力来翻译低资源语言。作为成果,NLLB团队开发了一个在线多语言翻译工具,名为NLLB-200,该工具能容纳200种语言,其低资源语言数量是高资源语言的三倍,翻译表现比已有系统高了44%。

由于NLLB团队在许多低资源语言上只能获取1000-2000例样本,为扩大NLLB-200的训练数据量,他们用一个语言识别系统发现了这些特定语言的更多实例。该团队还从互联网存档中挖掘双语文本数据,帮助提升了NLLB-200的翻译质量。

《自然》同期发表同行专家“新闻与观点”文章指出,NLLB团队研发的这个工具,可以帮助很少被翻译的那些语言的使用者,让他们能使用互联网和其他技术。

此外,NLLB团队还强调教育是一个非常重要的应用,因为这个模型可以帮助低资源语言使用者获取更多图书和研究文章。不过,该团队也提醒说,误译的情况仍有可能出现。(完)

免责声明:本站转载的文章,版权归原作者所有;旨在传递信息,不代表本站的观点和立场。
上一篇 2024-06-09 下午7:27
下一篇 2024-06-09 下午7:58

相关推荐

  • 成都“AI成长潜力”排名全国第二,人工智能领域科技型企业超900家

    6月19日,成都市政府新闻办举行“成都市人工智能产业高质量发展”新闻发布会,对《成都市人工智能产业高质量发展三年行动计划(2024—2026年)》(以下简称《行动计划》)和相关专项政策、实施细则等进行了重点解读。在人工智能领域科技创新方面,成都开展了哪些重点工作?成都市科技局党组成员、副局长王旭对此进行了解答。 王旭介绍,近年来,成都市科技局全面落实省委省政…

    2小时前
    0
  • 人工智能简介

    人工智能的快速发展给我们的工作和生活带来了许多变化,如何正确地认知这一技术,也成为了我们应当思考的问题。 欢迎来到人工智能的世界,一个正在改变我们工作和生活的领域。这个非技术性的课程将教会你如何在这个人工智能迅速崛起的时代中找到自己的位置。无论你是想揭开那些热门词汇背后的秘密,还是想在个人、企业或其他组织中应用人工智能,这门课程都将为你提供答案。 首先,我们…

    3小时前
    0
  • 国产芯片产能飙升40%,中国芯大爆发,海外芯片企业日子不好过了

    根据《南华早报》报道,今年一季度,中国大陆芯片产能同比增长了40%,达到981亿颗,其中三月份产能达到了362亿颗,再创历史新高。 这些产能大部分都是14nm以上成熟工艺,这说明国产芯片正在成熟制程领域正在快速替代,这些领域就包括炙手可热的新能源汽车。 一台普通燃油车需要100多颗芯片,功能强大的需要三四百颗,而一辆新能源汽车需要几千颗芯片,这个量差达到了1…

    5小时前
    0
  • 国产芯片大突破!龙芯中科取得巨大进展,芯片堆叠技术领先全球

    在全球科技快速发展的今天,芯片技术的竞争尤其激烈。芯片不仅是现代电子设备的心脏,更是衡量一个国家科技实力的重要标志。中国的芯片产业经过多年的发展,逐渐从跟跑者变为并行竞争者。近期,龙芯中科在芯片技术上取得了重大的突破,特别是在芯片堆叠技术领域实现了全球领先。这一成就不仅仅是技术的突破,更是中国芯片产业自力更生、破浪前行的重要标志。面对全球芯片行业的种种挑战和…

    6小时前
    0
  • 社会篇章:新质生产力一词的概念

    社会篇章:新质生产力一词的概念 近来晚间新闻联播总是述说新质生产力一词,那么什么是新质生产力呢? 新质生产力是创新起主导作用,摆脱传统经济增长方式、生产力发展路径,具有高科技、高效能、高质量特征,符合新发展理念的先进生产力质态。 以下是关于新质生产力的详细概念和作用: 概念 创新主导:新质生产力强调创新的核心地位,通过技术革命性突破、生产要素创新性配置和产业…

    11小时前
    0