在近日举行的 re:Invent 2024 大会上,亚马逊云科技(AWS)推出了一款新工具,旨在应对人工智能(AI)模型常见的“幻觉”问题。该工具被命名为“自动推理检查”(Automated Reasoning Checks),其核心目标是通过交叉验证客户提供的信息来检查和确保 AI 模型输出的准确性,从而减少模型错误或不准确回答的发生。
AI 幻觉问题的挑战
AI 幻觉是指生成式 AI 模型在回答问题时,基于统计模式和先前数据的推断,给出不符合实际的回答。尽管 AI 系统经过大量训练,能处理大量数据并给出“看似正确”的回答,但其本质上并不“理解”任何事物。它们更多的是通过已知的模式进行预测,因此生成的回答往往会存在误差,特别是在面对未见过的数据或复杂的推理任务时。
针对这一问题,AWS 的新工具“自动推理检查”旨在增强模型的输出可靠性,帮助客户过滤掉那些看似合理但实际错误的回答。AWS 宣称这是目前“第一个”也是“唯一”专门为解决幻觉问题而设计的防护工具,然而这一说法或许并不完全准确。此前,微软和谷歌也推出了类似的功能,试图减少生成式 AI 中的事实错误。
“自动推理检查”如何工作?
“自动推理检查”工具通过 AWS 的 Bedrock 模型托管服务和其中的 Guardrails 工具进行提供。用户可以上传他们的数据信息,作为事实基础,用于构建规则库。这个规则库将有助于引导 AI 模型的推理过程,并为模型提供一个可靠的验证标准。简单来说,该工具试图理解模型是如何产生答案的,接着与事实基础进行对比,以验证答案的准确性。
当模型给出回答时,“自动推理检查”会利用这些规则和事实库来确认生成的答案是否符合实际。如果发现模型输出的内容可能存在错误,工具会自动显示可能正确的答案,并将错误的回答与正确答案一同呈现。这使得客户能够直观地了解模型输出的偏差程度,并做出相应调整。
已开始应用与市场反响
AWS 表示,全球知名的审计和咨询公司普华永道(PwC)已经开始在其 AI 助手项目中应用“自动推理检查”工具。AWS 的 AI 和数据副总裁 Swami Sivasubramanian 透露,这一功能的推出也正是为了吸引更多客户使用 AWS Bedrock 模型托管服务,进一步提升平台的可信度和吸引力。
然而,尽管这一工具的设计目标明确,业内仍有声音指出,彻底消除 AI 幻觉仍然是一项极具挑战的任务。科技媒体 Techcrunch 引用专家观点指出,试图从 AI 模型中去除幻觉,就像是试图从水中消除氢原子一样困难。AI 模型并非理解性思考的实体,它们只是通过识别模式并预测下一步数据来生成回答。由于其依赖于数据模式的预测,模型的回答并非事实,而是一种基于概率的“最有可能的答案”。
关键词:亚马逊
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
投诉邮箱:Email:133 46734 45@qq.com腾达智能无线云台摄像机新品 CP3 Pro 现已上架京东商城,9 月 28 日 20:00-10 月 7 日 20:00 为定金支付阶段,10 月 7
虽然 AMD 此前已经收购了多家硬件公司,但收购的软件公司却少之又少。昨天,AMD 宣布收购人工智能软件公司 Mipsology。 Mipsolo
Mistral AI 是一家巴黎初创公司,七个月前由 Meta 和谷歌的研究人员创立,目前已筹集 3 85 亿欧元(约合 4 15 亿美元),这再
曾投资Twitter的著名初创投资公司a16z,所投资的人工智能(AI)初创企业 Character AI 由Google前AI研究人员组成。 Character AI
谷歌在今日凌晨的 I O 2023 开发者大会上公布了全新的 AI 语言模型 PaLM 2,这是其 PaLM 语言模型的第二个版本,将用于为
YouTube 官宣推出音乐 AI 孵化器,环球音乐集团是其首个合作伙伴。仅 2023 年,YouTube 上与 AI 工具相关的视频观看次数就超过
DevSecOps 的采用重塑了网络安全,但 DevSecOps 并不足以保证所有软件的安全。例如,人工智能 (AI) 和机器学习 (ML) 的加入
谷歌打算将他们的人工智能语言模型Gemini 直接整合到Android 手机中,计划将会在2025 年开始。谷歌透露会将Gemini Nano 整合到Android
Business Insider网站引述消息指称,亚马逊目前正在打造代号为Metis的聊天机器人,甚至由首席执行官Andy Jassy亲自坐镇参与开发,预
科大讯飞星火认知大模型V2 0正式发布,重点发布代码能力和多模态能力,并推出面向老师、学校、企业、开发者等更多元的应...
据报道,电子商务巨头亚马逊正在培训一种新的大型语言模型(LLM),以应对微软支持的OpenAI和谷歌母公司Alphabet提供的人...
人工智能(AI)的发展一日千里,除可生成图片、视频和声音外,AI初创公司Runway日前为旗下影片生成模型Gen-2推运动画笔功...
生成式 AI 应用 ChatGPT 引起风潮,专注新世代数字人才的求职平台 Yourator ,近期也推出了AI 履历小助理功能,不用 60 秒就
Nvidia 席执行官黄仁勋表示,该公司的下一代人工智能 (AI) 芯片平台名为 Rubin,将于 2026 年推出。 黄仁勋在参加 Computex
ChatGPT免费用户注意了,未来使用CahtGPT时,可能会出现广告,除非你升级至ChatGPT Plus会员。 ChatGPT首席财务官Sarah Friar于近
Minitab,LLC是数据分析、预测分析和流程改进的先驱,它宣布在3月底发布Minitab统计软件版本22,进行重大更新。这一最新版本...
华为近日发布了OceanStor A310 深度学习数据湖存储与FusionCube A3000 训 推超融合一体机商用 AI 存储新品,官方称这两款产
OpenAI稍早公布今年度的开发者大会活动日期,但似乎还不会太快将下一代自然语言模型GPT-5带到市场。 另一方面,The Information网站