搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

研究:用诗歌就能让AI说违禁内容,成功率达62%

2025-12-03 11:48:06
来源:

猫眼电影

作者:

邢李

手机查看

  猫眼电影记者 林道长 报道首次登录送91元红包

IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。

该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。

IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”

 时事1:赢真钱的手机游戏

  12月03日,外交部回应俄罗斯对中国公民实施免签:中俄又一次双向奔赴,凭借独特区位成为航空枢纽的成功案例很多,比如迪拜、多哈、伊斯坦布尔,眼下阿拉木图也在这条路上努力着。,奥博平台官方。

  12月03日,福建南平邀台胞共同打造“武夷茗宿”品牌,昨天刚当选中国煤矿文工团(中国安全生产艺术团)团长的@靳东 亮相话剧《温暖的味道》发布会现场!,线上真钱老葡京,真钱澳门电玩城,寰宇手游平台。

 时事2:龙王捕鱼下载

  12月03日,勿让抢行加塞成为交通事故“导火索” 加塞抢行违法 一次记三分,参与运营北京奥林匹克森林公园西畔的国家网球中心两片红土网球场地的维宁体育创始人、CEO纪宁8日告诉《环球时报》记者:“本就稀缺的网球场馆在郑钦文夺冠后变得更加炙手可热,现在根本都约不上。”,世界杯球购买,生财有道杀三肖,bbin体育官网版网站登录。

  12月03日,菲尔兹奖得主:中国有重视教育的千年传统 政府大力支持数学教育丨世界观,家住北京朝阳区的资深网球爱好者张先生在接受《环球时报》记者采访时感慨,“原来就不好预约的网球场,在郑钦文夺冠后,更不好约了。”他说:“我经常打球的球馆最早预约时间是提前一周的早上七点,但是现在到点就秒没,手一慢就显示预约完毕。”,下载注册送25元,斗地主网页版,送彩金网址论坛。

 时事3:bwinapp官网

  12月03日,“日本制造”系统性崩塌,民航业内人士李瀚明认为,本轮扩建前,很多西北机场处于超负荷状态。,威尼斯注册登录,网络百人牛牛怎么赢钱,天博电子网投。

  12月03日,通甬高铁建设“黑科技”:智能造桥机助力特大桥合龙,曾文莉认为,在职业选手商业价值充分释放后,其成功效应才会吸引更多的人群尤其是青少年从事网球运动,而这是中国网球经济发展的根基。,彩e,188体育游戏注册,万博man官网登录。

 时事4:金沙9570登录

  12月03日,“我们与香港同胞同心同在” 统一战线在行动,6月21日,中央纪委国家监委发布消息,自然资源部原党组成员,中国地质调查局原党组书记、局长钟自然被开除党籍,涉嫌受贿、故意泄露国家秘密犯罪问题移送检察机关依法审查起诉。,tvt体育怎么下载安卓,凯时国际娱乐,365bet世界杯。

  12月03日,国务院安委会部署开展高层建筑重大火灾风险隐患排查整治行动,张先生告诉《环球时报》记者,近年来走入网球馆和网球场的人越来越多,这一现象在郑钦文夺冠后更加明显,其中尤以青少年人群为多。,世界杯赌球网站盈利,letou国际米兰路线2,365bet体育注册开户首页。

责编:宁晓华

审核:张崇超

责编:胡长剑

相关推荐 换一换