猫眼电影
猫眼电影记者 刘永富 报道首次登录送91元红包
【文/观察者网 阮佳琪】
深度求索(DeepSeek)新品重磅发布,再度引爆AI圈。12月1日,中国人工智能(AI)初创企业DeepSeek推出两款正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。
据介绍,DeepSeek-V3.2定位“平衡实用”,其在主流推理基准测试中达到美国OpenAI的GPT-5水平;而在推理能力上大幅增强的DeepSeek-V3.2-Speciale,则在推理基准测试中取得了媲美谷歌深度思维11月下旬刚推出的新一代AI模型“双子座3专业版”(Gemini 3.0 Pro)。
DeepSeek还透露,其V3.2-Speciale版本在国际数学奥林匹克竞赛(IMO 2025)、国际信息学奥林匹克竞赛(IOI 2025)等均斩获金牌级表现。这一成绩直接对标行业巨头,此前仅有OpenAI和谷歌深度思维未对外公开的内部测试模型达成过这一成就。
香港《南华早报》2日报道指出,这一来自开源实验室的技术突破再次引发AI研究领域的广泛热议,尤其DeepSeek此次上新恰逢“AI界的奥斯卡”——2025年神经信息处理系统大会(NeurIPS)召开前夕。
作为当前全球最负盛名的机器学习和AI研究领域顶尖学术会议之一,NeurIPS大会每年举办一次,被中国计算机学会列为A类会议,在谷歌学术发布的全球学术期刊和会议影响力排名中位列第7,与国际机器学习会议(ICML)、国际学习表征会议(ICLR)并称为AI领域难度最大、水平最高、影响力最强的三大会议,代表着当今机器学习与AI领域的最高水平。
尽管向来行事低调的DeepSeek尚未公布是否会派员参会,但正在圣地亚哥参加NeurIPS大会的弗洛里安·布兰德(Florian Brand)已难掩兴奋。
这位专门研究中国开源AI生态系统的专家告诉港媒,如果DeepSeek的研究人员现身会场,大概率会引发高度关注。
他还透露:“DeepSeek发布新模型的消息一出,今天所有相关交流群都炸开了锅。(All the group chats today were full after DeepSeek’s announcement)”
港媒还提到,本届NeurIPS大会首次采用双会场形式,在美国加州圣地亚哥和墨西哥首府墨西哥城同步举办。这一安排主要源于主办方对国际研究人员获取美国签证可能遇阻的担忧,目前已有许多中国参会者选择前往墨西哥城会场参会。
DeepSeek-V3.2及其同类产品的基准测试。截图自DeepSeek技术报告
据官方介绍,DeepSeek-V3.2定位平衡推理能力与输出长度,适合日常使用,例如问答场景和通用智能体任务场景。在公开的推理类基准测试(Benchmark)中,V3.2达到了GPT-5的水平,仅略低于Gemini-3.0-Pro;相比Kimi-K2-Thinking,V3.2的输出长度大幅降低,显著减少了计算开销与用户等待时间。
DeepSeek评价称,V3.2“在智能体评测中达到当前开源模型最高水平”,大幅缩小了开源模型与闭源模型的差距,且未针对测试工具进行特殊训练。此外,该模型还是DeepSeek推出的首个将思考融入工具使用的模型,并且同时支持思考模式与非思考模式的工具调用。
DeepSeek-V3.2-Speciale则为“极致推理”而生,是V3.2的长思考增强版,同时结合了DeepSeek-Math-V2 的定理证明能力,以探索模型能力的边界。该模型具备出色的指令跟随、严谨的数学证明与逻辑验证能力,在主流推理基准测试上的性能表现媲美Gemini-3.0-Pro。
更令人瞩目的是,V3.2-Speciale成功斩获国际数学奥林匹克(IMO 2025)、中国数学奥林匹克(CMO 2025)、国际大学生程序设计竞赛全球总决赛(ICPC World Finals 2025)及国际信息学奥林匹克(IOI 2025)金牌。其中,ICPC与IOI成绩分别达到了人类选手第二名与第十名的水平。
目前,DeepSeek官方网页端、App和API均已更新为正式版V3.2。Speciale版本目前仅以临时API服务形式开放,以供社区评测与研究。相关模型已开源。
截图自DeepSeek技术报告
与两款新模型同步发布的,还有配套的技术报告。谷歌深度思维的首席研究工程师苏珊·张(Susan Zhang)在社交媒体上对此给予好评,称赞报告内容详尽,同时肯定了这家初创企业在模型训练后稳定性优化及智能体能力提升方面的努力。
彭博社指出,这一成果已清晰表明,中国开源AI系统至少在部分核心指标上,已经与硅谷顶尖专有模型具备同等竞争力。
美媒进一步解读称,此次新品发布也释放出一个重要信号:继今年1月推出突破性模型颠覆AI领域后,这家颇具影响力的AI实验室正持续加大研发力度,致力于提升AI运算的速度与效率,力求巩固其在中国AI赛道中的领先优势。
就在上周,DeepSeek刚发布了开源模型DeepSeek-Math-V2,该模型展现出强大的数学定理证明能力。
开源AI初创公司Hugging Face的联合创始人兼首席执行官克莱门特·德朗格(Clement Delangue)在社交平台X上盛赞道,“想象一下,你可以免费拥有世界上最优秀数学家之一的大脑。”
他强调,用户可以不受限制地探索、微调、优化这款中国AI模型,并在自有硬件上运行,“没有任何公司或政府可以收回它。这正是AI和知识民主化的最佳体现。”
“据我所知,此前没有任何聊天机器人或API能让你接触到一个IMO 2025金牌水平的模型。”德朗格补充说。
另据英国《金融时报》上周报道,美国麻省理工学院(MIT)和Hugging Face的一项研究发现,过去一年,中国团队开发的开源AI模型下载量占比上升至17%,超过了美国开发团队的15.8%。这是中国团队首次在这一指标上超越美国同行,取得AI技术全球应用中的关键优势。
在席卷全球科技行业的AI热潮之中,美国OpenAI、谷歌和Anthropic等科技巨头倾向于“封闭”策略,保持对先进AI技术的完全掌控,通过用户订阅和企业合作等方式获利。与之相比,中国科技公司倾向于更加开放的策略,发布了一系列开源模型。
德国智库墨卡托中国研究中心的高级分析师温迪·张(Wendy Chang)指出,“比起美国,开源在中国更像是一种主流趋势。美国公司不愿这样做,它们依靠这些高估值赚钱,不想公开自己的商业机密。”
根据MIT和Hugging Face的数据,DeepSeek和阿里云的Qwen是下载量最多的中国开源模型。《金融时报》称,DeepSeek-R1模型震惊了硅谷,该模型使用的成本和算力很低,但性能足以与美国顶尖模型比肩,引发各界对于美国AI实验室是否还能保持竞争优势的质疑。
MIT研究员谢恩·隆普雷(Shayne Longpre)表示,中国科技公司正在改变AI模型发布的范式,许多中国公司每周或每两周发布一次模型,并提供多种版本供用户选择。相比之下,美国科技公司往往每六个月或一年才发布一系列模型。
业内人士告诉《金融时报》,尽管美国出台了芯片出口管制等一系列打压措施,但中国拥有大量优秀人才,他们在开发开源模型的过程中展现出极强的创造力。
“当美国AI实验室押注于通过推动智能突破来获取巨额利益的同时,中国的开源模型竞争者更专注于推动AI的广泛应用,”《经济学人》总结道,“如果他们成功,DeepSeek的冲击可能仅仅只是一个开始。”
本文系观察者网独家稿件,未经授权,不得转载。
时事1:开云体育
12月03日,2025年度“中华助学金”发放仪式在沪举行,坚持出作品与出人才相结合,拓展思维,增强合力,努力为人才施展才华搭建平台,提供舞台;,世界杯投注量查看。
12月03日,广东自然岸线保有率逐年下降趋势得到根本性扭转,以西安咸阳机场为例,扩建后拥有4座航站楼,航站楼面积高居国内前5。但西安咸阳机场去年旅客吞吐量排在全国第11位,西安去年GDP仅排在全国第21位。,波克捕鱼官网首页,ug体育官方入口,imsport体育可靠吗。
时事2:世界杯热门投注趟c77,tv
12月03日,五部门联合开展医养结合促进行动,新疆机场集团总经理吕辉斌表示,国泰航空开通乌鲁木齐至香港航线,标志着乌鲁木齐天山国际机场的航线网络又一次升级,满足了新疆及周边地区旅客日益增长的出行需求,不仅提升了乌鲁木齐机场的国际化水平,也将进一步增强新疆的区位优势和影响力,共同助力打造乌鲁木齐成为连接亚欧区域门户复合型国际航空枢纽目标。,真钱赌城官网,AG真人游戏平台官网,明升体育下载。
12月03日,小小传感器,何以改变大世界?,曾文莉认为,在职业选手商业价值充分释放后,其成功效应才会吸引更多的人群尤其是青少年从事网球运动,而这是中国网球经济发展的根基。,沙巴网址是多少,九游会入口,bet体育反水。
时事3:球速体育平台下载地址
12月03日,助力推进“科学无障碍共享行动” 中国科技馆举办专项主题活动,去年,民航局、国家发改委联合发文《关于推进国际航空枢纽建设的指导意见》,画出国际航空枢纽的蓝图,提出“3+7+N”国际航空枢纽功能体系。,365bet在线手机客户端,pg电子游戏哪个平台好,九游会在线注册。
12月03日,解码中华文化基因:蜀锦,经纬间的文明对话,随着四座大型国际机场陆续启航,深居内陆腹地的大西北,能否迎来起飞?,赌钱app下载官网,九五至尊入口,优国际娱乐手机登录。
时事4:AOA买球
12月03日,陕西年度外送电量首次突破千亿千瓦时大关,而且在国泰之前,南航和乌鲁木齐航空已经开通了香港航线。相当于香港也不是乌鲁木齐的新航点。,168体育网,亚星官方娱乐,2026世界杯开买球网站。
12月03日,天津强化企业创新主体地位 培育超250家“猎豹企业”,西安咸阳机场T5,与北京大兴机场、成都天府机场航站楼面积相当。三座机场中规模最小的兰州中川机场T3,面积也相当于上海虹桥机场两座航站楼之和。,世界杯彩票网站关停,赌场大全,大富豪网址是多少。
责编:张国荣
审核:格林纳特
责编:唐建超












