搜索 猫眼电影 融媒体矩阵
  • 山东手机报

  • 猫眼电影

  • 大众网官方微信

  • 大众网官方微博

  • 抖音

  • 人民号

  • 全国党媒平台

  • 央视频

  • 百家号

  • 快手

  • 头条号

  • 哔哩哔哩

首页 >新闻 >社会新闻

重磅!DeepSeek V3.2 特别版发布:性能超越GPT-5,硬刚Gemini 3.0「IOI/IMO金牌」

2025-12-04 01:58:02
来源:

猫眼电影

作者:

林国洪

手机查看

  猫眼电影记者 西哲 报道首次登录送91元红包

↑阅读之前记得关注+星标⭐️,,每天才能第一时间接收到更新

DeepSeek-V3.2系列模型正式上线

作为“为Agent构建的推理优先模型”,DeepSeek-V3.2包含两个版本:

DeepSeek-V3.2:V3.2-Exp的官方继任者,平衡了推理能力与生成长度,性能对标GPT-5,现已上线App、Web端及API

DeepSeek-V3.2-Speciale:专攻深度推理能力的极限版本,性能超越GPT-5,比肩Gemini-3.0-Pro,目前仅通过API提供

技术报告显示,DeepSeek-V3.2-Speciale在2025年国际数学奥林匹克(IMO)、国际信息学奥林匹克(IOI)、ICPC世界总决赛及CMO中均取得了金牌级成绩

官方已公开上述竞赛的最终提交结果,社区可通过assets/olympiad_cases进行二次验证

技术报告:

https://huggingface.co/deepseek-ai/DeepSeek-V3.2/blob/main/assets/paper.pdf

以下是详细信息

核心能力与技术突破

DeepSeek-V3.2基于三大技术突破,实现了高计算效率与卓越推理、Agent性能的统一:

1.DeepSeek Sparse Attention (DSA):引入高效注意力机制,大幅降低计算复杂度,并针对长上下文场景进行了优化

2.可扩展强化学习框架:通过稳健的RL协议与后训练(post-training)算力扩展,实现了高性能表现

3.大规模Agent任务合成管线:涵盖1800+环境及8.5万+复杂指令

这一合成管线不仅提升了模型在复杂交互环境中的遵循度和泛化能力,更让DeepSeek-V3.2将“思考”直接整合进工具使用(Tool-Use)的模型,同时支持在思考和非思考模式下使用工具

API更新与Speciale版限制

DeepSeek-V3.2:

API使用模式与V3.2-Exp保持一致,作为日常主力模型(Daily Driver),提供GPT-5级别的性能

DeepSeek-V3.2-Speciale:

该版本专为解决复杂任务设计,消耗更多Token,目前仅作为API提供,具体限制如下:

临时端点:需使用

base_url="https://api.deepseek.com/v3.2_speciale_expires_on_20251215"

服务期限:该端点服务至2025年12月15日 15:59 (UTC) 截止

功能限制:不支持工具调用(Tool Calls),仅用于支持社区评估与研究。

定价:与DeepSeek-V3.2保持一致

聊天模板重大调整

DeepSeek-V3.2不再提供Jinja格式模板,并引入了“带工具思考”及新角色设定。

Python脚本编码:官方提供了encoding文件夹,包含Python脚本(encoding_dsv32.py),用于将OpenAI兼容格式消息编码为模型输入字符串及解析输出

Developer角色:模板新增developer角色,专门用于搜索Agent场景,官方API不接受分配给该角色的消息

输出解析注意:提供的解析函数仅处理格式良好的字符串,生产环境需自行增加稳健的错误处理机制。

代码示例如下:

import transformersfrom encoding_dsv32 import encode_messagestokenizer = transformers.AutoTokenizer.from_pretrained("deepseek-ai/DeepSeek-V3.2")messages = [ {"role": "user", "content": "hello"}, {"role": "assistant", "content": "Hello! I am DeepSeek.", "reasoning_content": "thinking..."}, {"role": "user", "content": "1+1=?"}]# 思考模式配置encode_config = dict(thinking_mode="thinking", drop_thinking=True, add_default_bos_token=True)prompt = encode_messages(messages, **encode_config)tokens = tokenizer.encode(prompt)本地部署建议

模型结构与DeepSeek-V3.2-Exp相同。

采样参数:建议设置 temperature = 1.0,top_p = 0.95。

Speciale版提示:本地部署Speciale版本时,同样不支持工具调用功能

开源与协议

仓库及模型权重均采用 MIT License 授权。

最后记得⭐️我,这对我非常重要,每天都在更新:

欢迎点赞转发推荐评论,别忘了关注我

 时事1:dafa娱乐场经典版手机登录

  12月04日,“以侨为桥”让世界“读懂中国” 专家学者现场支招,“当年李娜一度手握13个国内外知名品牌代言,而郑钦文在奥运夺冠之前已有10个代言品牌。”纪宁认为,网球目前在中国的热度已今非昔比,李娜时代已奠定的中国网球经济的热度,在郑钦文夺冠后会被逐渐引爆。纪宁还表示,网球作为全球顶级的职业体育和商业体育项目,正逐步释放巨大的产业经济空间。,必威客服端下载官网。

  12月04日,长篇报告文学《公仆榜样》作品研讨会在京举行,2018年自然资源部成立后,钟自然任自然资源部党组成员,中国地质调查局局长、党组书记。直至2022年9月卸任。今年1月2日,即2024年首个工作日,其官宣被查。,kok入口,lol比赛外围的网站,2020欧洲杯对阵图。

 时事2:yabo手机版注册

  12月04日,“不放弃任何一个求助”——香港消防员的48小时火海奋战,张先生认为,网球明星的出现与整个网球运动以及网球经济的发展是相互促进的,并形成正向反馈。他说,明星越多,示范效应就越强,就会更加刺激网球运动的发展,网球经济热度也会越高。而打网球的人多了,就会涌现出更多的网球明星。,凯发k8官网下载客户端中心,牛宝体育官网注册,mgm电竞。

  12月04日,宁夏银川:生态打底 让“塞上湖城”既有颜值更有内涵,去年,民航局、国家发改委联合发文《关于推进国际航空枢纽建设的指导意见》,画出国际航空枢纽的蓝图,提出“3+7+N”国际航空枢纽功能体系。,新万博官网,9州娱乐网址,明升体育登陆。

 时事3:金宝搏188下载

  12月04日,西藏广电公共服务提质升级 覆盖率超99%惠及各族群众,公器私用,将地质调查、矿产开发等权力作为敛财纳贿的工具,搞权钱交易,利用职务便利为他人在企业经营、项目承揽、矿权审批等方面谋利,并非法收受巨额财物;,永利博体育在线网,皇冠和365,庄闲和网址。

  12月04日,第四届大湾区工程师论坛在穗举办,以西安咸阳机场为例,扩建后拥有4座航站楼,航站楼面积高居国内前5。但西安咸阳机场去年旅客吞吐量排在全国第11位,西安去年GDP仅排在全国第21位。,网络抢庄牛牛怎么赢,网上体育下注平台,沙滩排球游戏下载。

 时事4:云顶集团首页网址

  12月04日,各地细化服务“组合拳”应对降温 保障百姓“菜篮子”“果篮子”稳定供应,在西北机场的你追我赶中,西安和乌鲁木齐最引人注目。两座机场不仅扩建规模最大,定位也更高。,巴黎人用户,永利体育开户,英亚体育APP。

  12月04日,2025中国高等教育学会科技服务专家指导委员会年会举办,张先生说,因为网球人群的增多,网球运动关联经济也更加活跃。球衣、球袜、球包以及打球的各种装备和周边产品,包括网球训练课都在走俏。比赛数量的增加,更是提升了各地运动场馆的利用率。,bbin体育足球,ayx爱游戏官网2020,bob里买球违法吗。

责编:郭京飞

审核:苗昊

责编:沈壮海

相关推荐 换一换