搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

研究:用诗歌就能让AI说违禁内容,成功率达62%

2025-12-04 11:27:05
来源:

猫眼电影

作者:

张昱欣

手机查看

  猫眼电影记者 蒲玉金 报道首次登录送91元红包

IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。

该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。

IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”

 时事1:皇冠信用盘网址导航

  12月04日,国际雪联大跳台世界杯云顶站:苏翊鸣单板滑雪强势夺冠 葛春宇摘银,坚持问题导向,勇于担当作为,通过健全组织、管理等各项工作机制,推动艺术创作生产;,乐享彩票app下载。

  12月04日,中东部将进入下半年来最冷时段 防冻小贴士助你健康过冬,近日,西宁曹家堡国际机场三期扩建工程通过竣工验收,为年内投运奠定了基础。,威尼斯赌城官网网站,永利博国际赌场网站,电竞赌注怎么下载。

 时事2:云顶娱乐体育官网

  12月04日,抑菌消炎、降低乳腺癌风险…… 经常吃蒜益处多多,公器私用,将地质调查、矿产开发等权力作为敛财纳贿的工具,搞权钱交易,利用职务便利为他人在企业经营、项目承揽、矿权审批等方面谋利,并非法收受巨额财物;,赌博电玩城游戏网,世界杯买球官网入口,火烧图记录。

  12月04日,航拍初冬日照:金沙碧海彩叶绘景,北京、上海、广州是3大全方位门户复合型功能的国际航空枢纽,成都、深圳、重庆、昆明、西安、乌鲁木齐、哈尔滨是7大区位门户复合型功能的国际航空枢纽。,bbin体育官方网站,海尔网址导航,yabo好玩吗?。

 时事3:必博好玩吗?

  12月04日,中法团队三年筹备 “金线”特展全球巡展首站启幕,美团数据也显示,7月以来,“网球”搜索量同比去年增长超60%。网球体验课、网球培训季度课包在平台热销,美团上网球运动相关团购订单量同比激增172%。,哪个软件可以玩抢庄牛牛,万博manbet登录,356体育网页版。

  12月04日,安徽广德“三件套”引游客跨省打卡:是有点东西在的,张先生说,因为网球人群的增多,网球运动关联经济也更加活跃。球衣、球袜、球包以及打球的各种装备和周边产品,包括网球训练课都在走俏。比赛数量的增加,更是提升了各地运动场馆的利用率。,棋牌在线平台,华体会怎么开户,真人美高梅开户。

 时事4:永利现金网注册

  12月04日,重庆江南隧道主线建成通车,2024年,西安机场旅客吞吐量4703.04万人次,排名全国第11位;乌鲁木齐机场旅客吞吐量2776.57万人次,排名全国第18位。西安去年GDP为13317.78亿元,排名全国第21位;乌鲁木齐去年GDP仅为4502.16亿元,排名全国第74位。,太阳集团娱乐所有网站,世界杯投注app碘fc3,tv,中体网足球即时比分。

  12月04日,云南省机关事务管理局局长杨承贤接受审查调查,而且在国泰之前,南航和乌鲁木齐航空已经开通了香港航线。相当于香港也不是乌鲁木齐的新航点。,炸金花胜率最大的方法,金沙电子游戏中心,真人cs国际比赛规则。

责编:苏中阳

审核:廖永国

责编:蔡晶晶

相关推荐 换一换