当前位置:首页 → 电脑软件 → 早苗狂言日本回归,靖国鬼厕又沸腾 → 澳门国际登入 v6.931 最新版
v2.105 IOS版
v5.199.8205.471998 安卓汉化版
v2.263.6594 PC版
v3.869.7067 安卓最新版
v1.70 最新版
v5.295.1999 安卓版
v7.448.1887 最新版
v4.694.1136 安卓汉化版
v4.426.8546.487742 PC版
v5.242.6860.377769 安卓版
v7.394.1671 最新版
v9.738.3695.743916 安卓最新版
v8.374 安卓版
v5.960 安卓最新版
v8.714 最新版
v4.917 安卓汉化版
v5.317 安卓免费版
v4.829.9838 安卓汉化版
v6.665.3925 安卓版
v4.400.3571.645792 IOS版
v3.338.2160.137142 安卓汉化版
v1.234.8295 最新版
v8.878 安卓汉化版
v3.358.7192.273967 IOS版
v3.26.151.998300 IOS版
v8.80.6108.793858 最新版
v2.721 安卓免费版
v5.902.1460 最新版
v2.151 安卓免费版
v6.702.9014.425775 IOS版
v3.366 安卓免费版
v1.426.5048 安卓最新版
v2.919.2833.86394 安卓免费版
v2.581.9384 PC版
v8.445 PC版
v8.619.7064 安卓免费版
v2.575 安卓最新版
v5.141.28 安卓最新版
v5.140 安卓版
v1.656 安卓免费版
v9.331.1642.267405 安卓版
v1.469.8959.476342 安卓汉化版
v5.585.5997 IOS版
v3.776 安卓汉化版
v4.910 安卓免费版
v8.95.6203.939553 安卓汉化版
v8.545.5897 IOS版
v5.952.8610 PC版
v6.926.3693 最新版
v3.780.2958 最新版
v6.89.9251.74515 安卓免费版
v4.135.9288.798694 安卓最新版
v4.703.2731.989293 安卓免费版
v1.668 安卓汉化版
v3.886 安卓汉化版
v6.614.8432 IOS版
v1.240.2239 安卓最新版
v8.932.4493.599710 安卓汉化版
v7.886.3013.927174 最新版
v4.112.5587 PC版
v1.510.3546 IOS版
v7.766.729 最新版
v7.504 IOS版
v4.828.5008 安卓版
v2.640 IOS版
v6.565.327 安卓最新版
v1.173 最新版
v9.115.8274 PC版
v9.136 IOS版
v7.196 IOS版
v7.370 最新版
v8.375 安卓汉化版
v2.842.8318 安卓版
v1.878.8951 安卓汉化版
v2.294 PC版
v4.829.7042 安卓免费版
v8.659.5339 安卓汉化版
v8.387.8889.149937 安卓版
v5.982.5741 最新版
v9.130.5783 PC版
澳门国际登入
IT之家 12 月 1 日消息,事实证明,只需一点创意,便足以绕过人工智能聊天机器人的安全防护机制。在伊卡洛实验室(Icaro Lab)最新发表的一项题为《对抗性诗歌:一种通用的单轮大语言模型越狱机制》的研究中,研究人员通过将提示词以诗歌形式表达,成功绕过了多种大语言模型(LLM)的安全限制。
该研究指出,“诗歌形式可作为一种通用型越狱操作符”,实验结果显示,整体上有 62% 的成功率诱使模型生成被禁止的内容,包括涉及制造核武器、儿童性虐待材料以及自杀或自残等相关信息。
IT之家注意到,研究测试了多款主流大语言模型,包括 OpenAI 的 GPT 系列、Google Gemini、Anthropic 的 Claude 以及其他多个模型。研究人员进一步列出了各模型的具体成功率:Google Gemini、DeepSeek 和 MistralAI 在测试中始终会提供违规回答,而 OpenAI 的 GPT-5 系列模型和 Anthropic 的 Claude Haiku 4.5 则最不容易突破其自身设定的限制。
尽管该研究并未公开研究人员所使用的具体“越狱诗歌”原文,但研究团队向 Wired 杂志表示,这些诗句“过于危险,不宜向公众披露”。不过,论文中确实包含了一个经过弱化处理的示例,用以说明绕过 AI 聊天机器人安全机制的简易程度。研究人员强调:“这可能比人们想象的要容易得多,而这正是我们保持谨慎的原因所在。”
相关版本
多平台下载
查看所有0条评论>网友评论