人工智能破解测试:Anthropic模型自主发现评估并解密答案
创始人
2026-03-09 21:15:58
0

3月9日,人工智能公司Anthropic在基准测试BrowseComp中发现其ClaudeOpus4.6模型展现出前所未有的能力。在1266个任务中的两个任务里,该模型不仅自主发现自己正处于评估中,还识别出了具体的基准测试,并破解了答案密钥。

ClaudeOpus4.6模型在全面网络搜索失败后,开始将答案搜索与对问题本身的分析结合起来。模型怀疑这是人为设计的题目,可能是考试题或大语言模型基准测试的内容。随后,它系统性地遍历已知基准测试列表,在核对122个验证问题后排除了GAIA,最终派遣子智能体执行定向搜索,定位到BrowseComp及其解密机制。正确答案采用异或(XOR)加密,需要源代码中存储的密钥才能读取数据。Claude在公开可访问的代码中同时找到了加密方式和密码,随后自行编写程序解密答案。

Anthropic表示,这是首个有记录的案例:模型在事先不了解特定基准测试的情况下,反向识别并破解了评估本身。公司同时承认,这一发现引发担忧:为完成任务,模型可能会采取何种程度的行动,尤其是在复杂、算力密集、长时间运行的任务中。Anthropic呼吁研究界将评估完整性视为持续的对抗性问题,而非一次性的设计决策。

相关内容

热门资讯

阿维塔06T旅行车预售开启:2... 4月8日,阿维塔品牌在新品发布会上宣布旗下首款旅行车06T开始预售,共推出4款车型,价格区间为22....
奇瑞瑞虎7L与全新瑞虎7全球上... 4月8日,奇瑞汽车宣布瑞虎7L及全新瑞虎7全球上市。瑞虎7L推出4款配置车型,限时优惠价7.89万-...
比亚迪方程豹钛7EV闪充版开启... 今日,比亚迪宣布其方程豹钛7EV闪充版将首次搭载肯德基“车速取”智能点餐功能,实现在车内无需使用手机...
东风日产NX8增程SUV上市:... 4月8日,东风日产首款增程SUV车型NX8正式上市,提供增程和纯电动力选择。新车均采用800V碳化硅...
零跑Lafa5Ultra震撼登... 4月8日,零跑汽车宣布旗下Lafa5车系的顶配版本Lafa5Ultra正式亮相,并计划于4月上市。L...
女子自助餐一次吃12个汉堡,第... 4月7日,女子发帖称“常州某汉堡自助因顾客吃得多,老板报警”,内容为跟警察的对话音频。记者采访了解到...
宁夏56岁司机开车时突发疾病,... 4月6日,一段发生在京藏高速公路上的生死瞬间,让无数人红了眼眶。56岁的宁夏吴忠同心县客车司机周岐红...
服务商户发展+群众购物,广州亮... 专业市场连着千万商户的生计,也连着市民群众的关注。4月8日,广州发布《广州市加快推动专业市场转型升级...
广州珠江新城马场地块今天正式动... 4月8日,广州珠江新城马场地块正式动工。马场地块是越秀集团于今年2月25日以236亿元竞得的广州珠江...
2026洋葱飞船音乐节本周末在... 2026音乐奇航大湾区洋葱飞船音乐节将于本周末(4月11日至12日)在广州南沙音乐秀场正式启动。目前...
超50位院士将齐聚广州南沙,首... 今年4月,广州南沙迎来一场学术与产业的高规格对话。首届中国“AI+新材料”大会将于2026年4月10...
广州暨大港澳子弟学校创新国情教... 4月2日,“世界课程改革浪潮下的中国叙事——粤港澳中小学校长思享汇”在广州暨大港澳子弟学校保利校区举...
“历史必须被铭记,必须被捍卫”... “这本相册是直视历史真相的窗口,历史必须被铭记,必须被捍卫。”美国青年埃文·凯尔谈及那本记录侵华日军...
视频丨美经济学家:所谓对伊开战... 据美国方面6日消息,多位经济学家对美国政府近日提出的“一旦伊朗战事结束,美国经济将迅速复苏”这一说法...
【理响中国】领导干部应当树什么... “干部干部,干字当头”。当干部就要干事,就要创造业绩。应当创造怎样的业绩,这是每一名领导干部都要回答...
焦点访谈|重大工程夯实中国经济... 央视网消息(焦点访谈):近日公布的“十五五”规划纲要专门提出了6方面109项重大工程项目。这109项...
开局之年看中国丨意念控物 废物... 如果山河有记忆中原刻下的不只是历史的厚重更有创新的锋芒战略性新兴产业占规上工业增加值比重超过25%七...
石榴数据线|春意浓、消费热 清... 清明假期,商务部门重点监测的零售、餐饮企业销售额较去年同期增长3.9%。清明假期,新疆消费市场供需两...
深圳喊话“带板”,惠州反手“送... 一湾双城当紧邻大亚湾的深圳和惠州在粤BA赛场相遇除了“友谊”“宵夜”与“比赛”还可能擦出什么火花来?...
4月10日18时起,广东公安交... 4月8日,记者从广东交警获悉,为进一步加强全省公安交管信息系统运行保障能力,提升服务群众效能,广东省...