构建大模型幻觉及其价值风险的预防治理体系
大模型幻觉的生成原因
在人工智能领域,幻觉特指大模型生成的内容看似语法正确、逻辑严谨,但实际上存在着事实错误或无法验证事实的现象,具有“一本正经胡说八道”、无法确认现实依据等特征。大模型的幻觉包括事实性幻觉与忠实性幻觉两种类型,前者指的是与事实不一致或存在事实捏造,后者指的是生成内容与用户指令不一致、上下文不一致或逻辑不一致。
在本质上,大模型的幻觉问题是其技术架构、训练和生成模式共同作用的产物,具有一般性、偶然性、随机性、难以避免或克服等特征。在生成机制上,大模型幻觉的核心成因来自概率驱动的技术架构、训练数据局限性以及人机互动生成逻辑的多重耦合。
首先是技术架构的能力短板。目前大模型主要采取基于转换器结构的GPT范式,这种技术架构确能大幅度提高自然语言处理的精度与效率,但在预训练、监督微调、推理等环节都可能存在能力短板,产生与事实、指令或上下文不一致的幻觉问题。例如在预训练阶段,大模型通过自回归生成方式,基于历史标记的概率分布逐词预测输出。这种机制天然缺乏对上下文语义一致性的把控能力,容易优先选择概率更高但与事实、逻辑不一致的词汇组合,输出形成“语法正确但内容失真”的幻觉。
其次是训练数据的天然缺陷。大模型基于互联网海量数据进行深度学习,但由于互联网语料并未经过严格检验处理,或者由于错误标注,不可避免存在事实错误或逻辑矛盾,大模型缺乏对数据真实性的鉴别能力,容易抓取或根据错误数据生成回答。例如,当要求GPT4大模型讲述“林黛玉倒拔垂杨柳”的故事时,大模型并不能辨析其中的陷阱,而是未经事实验证直接从海量文本数据中进行内容拼接,编造出一段荒谬情节。
最后是人机互动的刻板误伤。大模型采取的人类反馈强化学习,容易导致大模型在刻意逢迎人类需求过程中出现信口开河、事实伪造等问题。如加拿大航空聊天机器人在错误理解“特殊退款”概念后,连续生成虚构的退款条件与时限,最终酿成法律纠纷。大模型特有的技术架构和生成逻辑,导致幻觉具有自我强化的危险性。
大模型幻觉的价值风险
大模型幻觉的随机出现和难以避免,还存在着削弱人机信任、导向信息极化、冲击社会秩序甚至引发意识形态安全危机等价值风险,亟待加强预防与治理。
大模型幻觉最直接的危害就是对用户决策的误导,特别是在医疗、健康、金融等领域。大模型的权威性表达风格与流畅的叙事逻辑,使得错误信息具有极强的迷惑性。如果用户过于依赖大模型生成信息辅助决策,很有可能被误导进而产生严重后果。例如,相信大模型提供的错误治疗方案,可能导致疾病无法控制甚至进一步恶化。长此以往,恐将削弱人机信任关系。
更令人担忧的是,大模型幻觉引发的价值风险呈现出从个人决策误导向群体认知偏差、社会秩序冲击的扩散路径。在公共决策领域,幻觉可能扭曲政策认知,如果不加强对大模型输出信息的甄别与把关,很有可能出现误读政策、发表歧视言论等幻觉问题,不仅会削弱政府公信力,甚至会危及社会公共安全。
在意识形态安全领域,相关威胁更加隐蔽。例如,相关研究监测到,某些境外大模型带着意识形态的有色眼镜看待中国特色社会主义发展成就与制度优势,刻意混入虚假事实或错误评价,形成与主流话语不同的输出。这种经过意识形态包装的幻觉内容,通过知识问答形式进行价值渗透,其误导性远超传统虚假信息。
大模型幻觉的治理对策
预防与治理大模型幻觉,应构建技术纠偏、法律规制与伦理调适的三维治理体系,通过技术优化消除幻觉问题,借助法律规制明确责任边界,依托伦理调适培育价值理性,使大模型成为人类更可靠的合作伙伴。
构建多层次防治体系。“以技治技”是解决大模型幻觉问题的首选路径。人工智能伦理的“价值敏感设计”或价值对齐策略,也有赖于技术层面创新与突破。这不仅需要人工智能企业与专家通过提高训练数据质量、加强外部验证与事实检查、改进模型推理能力、增强透明度与可解释性等途径提升大模型性能,而且鼓励哲学社会科学专家与人工智能专家携手合作,通过知识库优化、训练语料纠错、价值对齐监测等途径,帮助大模型提高问答正确率,消除潜在的幻觉问题与价值风险。
建立适应性治理框架。面对大模型的普及化应用,敏捷、柔性、规范的立法治理势在必行。国家网信办等七部门颁布实施《生成式人工智能服务管理暂行办法》,对训练数据选择、模型生成与优化、服务提供等提出明确的法律规制与风险防范要求,有利于推动“智能向善”,促进大模型的合规应用。欧盟《人工智能法案》要求大模型履行告知义务、确保技术方案的稳健性和可靠性等规范要求,对大模型的应用形成有效的制度约束和问责框架,值得参考借鉴。
提高技术开发应用的价值基准。对大模型幻觉更有意义的治理创新在于建立技术价值观,将负责任创新、可控创造性等伦理价值融入工程师的头脑、植入大模型的代码。例如,倡导存在争议结论不生成、无法溯源的信息不生成、超出模型认知边界的内容不生成等原则,推动大模型从追求生成流畅度向确保内容可靠性转型;又如,建立大模型回答事实性问题分级置信提示制度,按照高可信、需核实、推测性结论等进行分类标注,加强输出内容的透明度与可解释性。
对用户而言,应进一步提高科学正确应用大模型的信息素养,进而成为引导内容生成的指挥官、幻觉问题的甄别者。研究表明,经过人工智能交叉验证等使用习惯培训,能够显著降低用户被幻觉误导的概率。人们需要与时俱进地提升自身辨析幻觉、掌握常识、批判思考的综合能力,在利用大模型检索信息、生成内容的过程中遵守履行事实核查、逻辑验证、专业甄别、最小必要、场景控制等价值原则,最大限度消除幻觉问题和价值风险。
人工智能的可靠性建设往往滞后于其能力扩展。治理大模型幻觉的终极目标不是完全消灭技术的不确定性,而是要建立风险可控的人机协同机制。在这场人机协同的赛博进化中,始终保持技术的谦逊与伦理的清醒,是破除大模型幻觉迷雾的应有之义。
标签:
抢先读
- 构建大模型幻觉及其价值风险的预防治理体系
- 多品牌战略再升级 安踏集团宣布收购德国狼爪
- 今年全国快递业务量已突破500亿件
- 新华财经|AI机器人 广东打算怎么做?
- 高校团队在介电储能领域取得突破性成果
- 高校团队在介电储能领域取得突破性成果
- 今年全国快递业务量已突破500亿件
- 海南洋浦区域国际集装箱枢纽港首个20万吨级泊位投用
- 金价为何坐上“过山车”
- 消博会“黑科技”提前看:海南“车路云一体化”应用成果首次展示
- 第五届消博会开幕在即 中外展商紧抓“消博”机遇
- 福建漳州成立低空技术校企合作联盟
- 上海多举措促进专精特新中小企业发展壮大 大模型等加速其成长
- 上海多举措促进专精特新中小企业发展壮大 大模型等加速其成长
- 中马国际高科技生态产业园协议在深圳签署
- 上海专精特新中小企业数量超1.2万家
- 上海专精特新中小企业数量超1.2万家
- 上海专精特新中小企业数量超1.2万家
- 财政部:加强产权交易机构开展金融机构国有产权交易业务管理
- 港股三大指数止跌回升
- 浙江首个智慧零碳供能高速服务区投运
- (乡村行·看振兴)枳壳花开白如雪 江西南城药材变“药财”
- 中国多家电商和零售企业宣布支持“出口转内销”
- 雪峰山深处春茶飘香 湖南新化高山茶园成“绿色银行”
- 第九届全国石油石化装备产业基地建设与发展大会在四川广汉举行
- 浙江首个智慧零碳供能高速服务区投运
- 中国手机经历过大风大浪,“OPhone的含金量还在上升”
- 浙江首个智慧零碳供能高速服务区投运
- 中国手机经历过大风大浪,“OPhone的含金量还在上升”
- 李熠:数字孪生技术正为人工智能发展提供数据支撑
- 关税沦为游戏,美国已成笑话
- 广州海关发布支持第137届广交会12项便利措施
- 李熠:数字孪生技术正为人工智能发展提供数据支撑
- 广东发明专利有效量突破80万件
- 广州海关发布支持第137届广交会12项便利措施
- “尧七味” 亮相 山西临汾中药材产业从“卖资源”向“卖品牌”转型
- 海南自贸港首个“人民币海漂铁矿石掉期”产品上线
- 海南自贸港首个“人民币海漂铁矿石掉期”产品上线
- 广东发明专利有效量突破80万件
- 中基协发布修订后的《基金经营机构及其工作人员廉洁从业实施细则》
- 中基协发布修订后的《基金经营机构及其工作人员廉洁从业实施细则》
- 宁夏跨省物流大通道建设迈入新阶段
- 国家邮政局:3月中国快递发展指数同比增长5%
- 成都发力首发经济 鼓励国际化品牌来蓉开店
- 云南昌宁:林下经济点“绿”成“金”
- 从走出去到扎下根,无锡小电驴勇闯世界
- 各地一批重大工程有序推进
- 泰国籍大型液化气船在福建宁德完成维修交付
- 高速开车睡觉,谁制造了“全民智驾”幻觉?
- 碳路中国 | 中国新增可再生能源发电量占全球六成
- 国家金融监督管理总局发布《保险集团并表监督管理办法》
- 加码布局中国市场 多家外资金融机构积极创新 加速拓展在华业务
- 4月7日以来,已有48家中央企业宣布增持回购
- 碳路中国 | 中国新增可再生能源发电量占全球六成
- 一季度中国铁路完成固定资产投资同比增5.2%
- 4月7日以来,已有48家中央企业宣布增持回购
- 泰国籍大型液化气船在福建宁德完成维修交付
- 加码布局中国市场 多家外资金融机构积极创新 加速拓展在华业务
- 碳路中国 | 中国新增可再生能源发电量占全球六成
- 百年青啤:持“质”以恒 焕消费新光 青岛啤酒举办第47届“提高质量纪念日”活动
- 深交所:围绕关键领域助力打通中长期资金入市的卡点堵点
- 国家综合货运枢纽补链强链第一批典型经验发布
- 第137届广交会每期将设1万平方米进口展区
- 今年首季上海口岸进口冰鲜水产品同比增长6.6%
- 迎峰度夏不限电,苏州有何秘诀?
- 南京推行政检查码 以数字赋能规范执法新路径
- 海南出台2025版优化营商环境重点举措 推出166条具体任务
- 全球塑料有多少产自回收材料?中国团队最新研究发现不足10%
- 全球塑料有多少产自回收材料?中国团队最新研究发现不足10%
- 海南出台2025版优化营商环境重点举措 推出166条具体任务
- 海南出台2025版优化营商环境重点举措 推出166条具体任务
- 海南出台2025版优化营商环境重点举措 推出166条具体任务
- 迎峰度夏不限电,苏州有何秘诀?
- 海南出台优化营商环境新举措 外资企业登记服务再升级
- 上合组织可持续发展投资促进活动天津举办 签约金额47.95亿元
- 海南出台优化营商环境新举措 外资企业登记服务再升级
- 抢抓市场机遇 中小企业加速向智能化、数字化、绿色化转型
- 凝心聚力 实干笃行丨打开世界地图做生意 中国企业走通“出海”之路
- 2025全球6G技术与产业生态大会在南京召开
- 深圳宝安打造全国首个“场景全域开放标杆城区”
- 一季度全国铁路固定资产投资完成1312亿元 同比增长5.2%
- 开创乡村全面振兴新局面
- 2025全球6G技术与产业生态大会在南京召开
- 第五届消博会将于4月13日开幕 提前解锁各大展馆亮点
- 2025全球6G技术与产业生态大会在南京召开
- 电商平台AI造假频现 警惕批量生成的“买家秀”
- 开创乡村全面振兴新局面
- 现货黄金首次突破3200美元大关
- 旅游观察:这届银发族重新定义旅游消费新潮流
- 新开发银行发行70亿元人民币3年期熊猫债
- 现货黄金首次突破3200美元大关
- 现货黄金首次突破3200美元大关
- 京东外卖推出百亿补贴,一年内投入超100亿
- 山东鄄城:科学采伐除隐患 道路升级保畅通
- 140台前沿农机密山市“炫技” 助推农业发展
- 广州海事部门多措并举护航广州港一季度实现“开门红”
- 福州航标处更新平潭海峡公铁两用大桥水域部分航标 护航“海上通道”安全畅通?
- “天津之眼”摩天轮景区将于4月13日起暂停运营
- 广州海事部门多措并举护航广州港一季度实现“开门红”
- 第三届中国(西安)国际矿业装备与技术展览会举办