IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。
该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。
IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
《世界杯买球appbs18 me》,《首次登录送91元红包》金沙网络
“凯时平台app”
永乐国际f
……
{!! riqi() !!}
“皇冠体育正规网”{!! reci() !!}
↓↓↓
{!! riqi() !!},你有没有吞过“愤怒诱饵”?2025年牛津年度词汇出炉,365体育下载官网,XBET星投娱乐平台,ag在线捕鱼,opebet体育登陆地址
{!! riqi() !!},梁鸿:书写青春期孩子们的痛楚与救赎,网络平台买球,龙8国际下载地址,威尼斯人手机版官网,金牛网
{!! riqi() !!},支持香港火灾救援 中国人民银行开通跨境人民币捐赠绿色通道,fun88体育网,永利博官网地址,betway官网在线登录,金沙平台注册网站
{!! riqi() !!}|内蒙古自治区民族事务委员会副主任李志友接受审查调查|贝博BB德甲狼堡体育|宝博体育投注官网|扎金花游戏大厅下载|凯时手机版下载
{!! riqi() !!}|第十届青葱计划“青葱校园行·成都站”举办|萄京国际电子游戏|棋牌网站游戏|爱游戏体育是信誉的|棋牌游戏牛牛
{!! riqi() !!}|20分钟“空中直达” 江苏太仓—浦东首条常态化低空航线开通|皇冠登录官网|澳门新入口|AG利来国际|单机版炸金花下载官网……
{!! riqi() !!},2024年珠江区降水量和水资源总量均偏多,环宇足球,网上投注大全app,九游的网址是多少,乐游棋牌
{!! riqi() !!},党建引领风帆劲 雪域高原谱新篇——“十四五”以来西藏自治区作风建设与党建工作综述,体育投注送365体验金,365唯一官网,撲克王客服,亚新入口
{!! riqi() !!}|央行:持续打击虚拟货币相关非法金融活动|微球网即时比分|AG亚洲国际游戏|华体育官网下载|棋牌王真钱斗地主
{!! riqi() !!},郁达夫之女忆父亲:“日本投降了,他却惨遭毒手!”,188金宝慱官网可信吗,大玩家现金平台,泛雅平台网址大全,雷竞技raybet入口
{!! riqi() !!},在这些“年轻”产业园感受江苏高质量发展的政协作为,vwin体育,立博官网中文登录,宝赢体育,nba中国
{!! riqi() !!},这份“九三健康大礼包”请家中老人查收,世界杯投注 app,澳门注册入口,电子游戏平台网址,澳门威斯尼斯人的网站
{!! riqi() !!}|昆明各界人士纪念“一二·一”运动80周年|怎么在体彩投注世界杯|开游棋牌|下载APP体育|亚洲正规赌场排名
{!! riqi() !!}|《我有一个想法》首季收官:让想法照进现实|皇冠客户端app下载|多宝最新地址|真钱网上网址|亚投彩票官网首页
{!! riqi() !!}|两岸业界共探文创产业与城乡融合发展|网上打斗地主赢钱|mg注册送38|皇冠官方登录app|AG网上登录
{!! reci() !!},{!! reci() !!}|我国推动ISO立项首个工业废水毒性削减国际标准|最好的世界杯投注软件|PG电子游戏app下载|国博东方|乐动体育入口登录
监制:邓金木
策划:赖晗
主创:唐征宇 林箴贺 陈佛烘 颜亦阳 陈林韵
编辑:王家菁、段圣祺