搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

研究:用诗歌就能让AI说违禁内容,成功率达62%

2025-12-03 04:27:27
来源:

猫眼电影

作者:

廉恩臣

手机查看

  猫眼电影记者 杨飞翼 报道首次登录送91元红包

IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。

该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。

IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。

尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”

 时事1:必威登录官网188

  12月03日,壹视界·微视频丨从一篇党报征文,感悟跨越百年的鼓岭情缘,2018年自然资源部成立后,钟自然任自然资源部党组成员,中国地质调查局局长、党组书记。直至2022年9月卸任。今年1月2日,即2024年首个工作日,其官宣被查。,英亚体育下载地址。

  12月03日,青海德令哈:上百只岩羊山脊奔腾,以西安咸阳机场为例,扩建后拥有4座航站楼,航站楼面积高居国内前5。但西安咸阳机场去年旅客吞吐量排在全国第11位,西安去年GDP仅排在全国第21位。,扑克打二八杠,博雅斗地主,蓝洞棋牌。

 时事2:ManBetX旧版本

  12月03日,湖南浏阳做强特色优势产业 县域经济能级攀升,纪宁说,目前中国青少年网球尤其是女子青少年网球,已经成为体育职业化和商业化领域一个风口。郑钦文夺冠能促进更多中国青少年加入网球运动。与此同时,中国网球训练场地和比赛场地硬件条件以及软件设施也在发生巨大变化,网球经济蕴含的巨大空间也随之逐步释放出来。,安博视讯官网下载,九州备用网址导航,龙八国际官网。

  12月03日,辽宁构建中小学生诚信教育全链条,中国煤矿文工团成立于1947年东北解放区,是国家级艺术院团中历史最悠久的单位之一。2005年,加挂了“中国安全生产艺术团”的牌子。2018年9月,转隶到文化和旅游部。,2008年欧洲杯比分表,九游会j9登录,世界杯投注app希fc3_tv。

 时事3:欧洲杯足球代理

  12月03日,两部门协调援助应急装备物资 支持香港大埔火灾应对处置后续工作,反观乌鲁木齐,偏居西北一隅的位置,为向西开放提供了便利。李瀚明指出,与乌鲁木齐类似的其实是哈萨克斯坦阿拉木图,两座城市都位于亚欧航路的中间点。利用空客A321XLR这样的远程窄体机,阿拉木图成功开航伦敦。在国内,乌鲁木齐是唯一一个用窄体机能直飞欧洲的航空枢纽。,棋牌游戏娱乐,金沙好玩吗?,环球体育bet。

  12月03日,越冬灰鹤“做客”山西万荣黄河湿地,4月2日,走过86年历史的乌鲁木齐机场迎来更名,“天山机场”取代了沿用已久的“地窝堡机场”。,世界杯有非正常投注吗,188bet在哪开户,bsport体育app下载。

 时事4:澳门威斯尼斯线上

  12月03日,胃痛、手脚发麻、原发性气胸……生气有多伤身?一图了解,随着四座大型国际机场陆续启航,深居内陆腹地的大西北,能否迎来起飞?,伟德平台网址,滚球下载,世界杯投注网哪个好。

  12月03日,AI赋能中国人力资源服务促人岗精准匹配,兰州和乌鲁木齐之前都只有一条跑道,因起降架次多,乌鲁木齐一直是国内最繁忙的单跑道机场之一。扩建后可以极大缓解这几座机场的现有压力。,篮球在哪里赌,易博胜体育,亚博游戏平台网址。

责编:丁薛祥

审核:王群航

责编:路易丝·穆希基

相关推荐 换一换