新研究:新技术助力人工智能减少“胡诌”

人工智能(AI)中广泛使用的大语言模型不时出现的“一本正经地胡诌”是其难以克服的问题。近日,英国牛津大学研究团队开发出一种名为“语义熵”的新方法,有望大幅提升AI回答的可靠性。

大语言模型的“胡诌”在业界被称为“幻觉”,牛津大学计算机科学系的研究人员提出“语义熵”方法试图解决这一问题。在热力学中,熵描述的是系统的混乱或者说不稳定程度。这项研究中,熵衡量了大语言模型回答的不确定性,不确定性高意味着大语言模型的回答可能存在虚构。

该研究成果已发表在近期出版的英国《自然》杂志上。论文中说,如果AI对同一个问题,给出了许多语义相似的答案,那说明它对自己的回答比较有把握;反之,如果答案五花八门,那就意味着AI自己也“心里没底”,很可能是在“胡诌”。

研究人员利用“语义熵”方法,让大语言模型对同一问题生成多个答案,然后将语义相近的答案聚类,最后根据聚类结果计算熵值。熵值越高,表示大语言模型的回答越不确定。

值得注意的是,这一方法不仅考虑了大语言模型回答的字面差异,更关注语义层面的一致性。这使得“语义熵”能够更准确地识别AI的“胡诌”,而不会被表达方式的多样性所迷惑。

研究结果表明,“语义熵”方法在多个数据集和任务中都表现出色,能有效检测大语言模型的错误回答,并通过拒绝回答不确定的问题来提高整体准确率。更重要的是,这一方法无需修改AI模型本身,可以直接应用于现有的大语言模型。

研究人员说,“语义熵”技术有望在问答系统、文本生成、机器翻译等多个领域发挥重要作用,帮助AI生成更可靠、更有价值的内容。这不仅将提升AI在实际应用中的表现,也将增强用户对AI系统的信任。(辛华)

来源: 新华网

【来源:经济界】凡本网注明“来源:经济界” 的所有作品,版权均属于经济界。如转载,须注明“来源:经济界”。违反上述声明者,本网将追究其相关法律责任。
Previous 2024-06-26
Next 2024-06-26

相关推荐

  • Soul App:以创新引领社交新潮流,斩获多项殊荣彰显企业价值

    过去的2024 年对于 Soul App 来说,是极具意义且硕果累累的一年。 作为一款深受年轻用户喜爱的社交平台,Soul App 不仅在产品功能与用户体验上持续精进,更在技术创新、社会价值创造以及行业影响力拓展等多个维度实现了突破,接连斩获多项重量级奖项,充分彰显了企业的综合实力和卓越价值。 一、36kr:WISE2024 文化与内容领域年度最具商业价值企…

    1天前
    0
  • 华安基金科创板ETF周报: 市场反弹,科创50指数上周涨1.61%

    科创板政策及行业动态一览: 行业动向: 1月13日,中国证监会召开2025年系统工作会议,总结2024年工作,深入推进巡视整改,研究部署2025年重点工作。其中提到“研究制定更好支持新质生产力发展的政策安排,深化科创板、创业板、北交所改革,增强制度的包容性、适应性。”、“抓好创投十七条、科创板八条等落地实施,发展多元化股权融资,培育壮大耐心资本。”、“进一步…

    1天前
    0
  • Soul App:以创新引领社交新潮流,斩获多项殊荣彰显企业价值

    过去的2024 年对于 Soul App 来说,是极具意义且硕果累累的一年。 作为一款深受年轻用户喜爱的社交平台,Soul App 不仅在产品功能与用户体验上持续精进,更在技术创新、社会价值创造以及行业影响力拓展等多个维度实现了突破,接连斩获多项重量级奖项,充分彰显了企业的综合实力和卓越价值。 一、36kr:WISE2024 文化与内容领域年度最具商业价值企…

    2天前
    0
  • 科技达人组团开年大考!海信新风空调上大分

    “就拆个机的功夫,真的没任何异味了”。 2025年开年,海信新风空调携手电器哥梓涵、陶阳实验室等多位知名科技类大V来到海信研发中心,以一场“眼见为实”的达人团探访活动,带领大家见证海信空调“开机3分钟,满屋是新风”的清新体验。在新风实验室中,FRESH AIR指示灯由红变绿,刚才还充斥浓重烟雾和刺鼻油烟异味的空气,经过海信新风空调的焕新净化,已经变得清新宜人…

    2025-01-15
    0
  • 海信家电荣膺“上市公司最具品牌价值奖”

    1月11日,2024(第八届)博鳌企业论坛在海南召开。活动邀请部委领导、专家学者、企业家、媒体代表等嘉宾,解读经济政策形势,探讨产业发展策略。在“博鳌荣耀之夜盛典”的颁奖环节中,海信家电(SZ 000921,HK 00921)凭借稳健的经营业绩与卓越的品牌影响力,荣膺“2024年度上市公司最具品牌价值奖”,董秘张裕欣获评2024年度(行业)杰出董秘。 作为联…

    2025-01-14
    0