DeepSeek最强对手来了！阿里巴巴放出重磅炸弹

远东宏信发布中期业绩股东应占期内溢利21.64亿元同比增加3.77%科技水平又一个里程碑 中药上市公司董秘PK：以岭药业吴瑞、昆药集团张梦珣、金花股份张朝阳为唯三博士董秘是真的吗？ 神马股份(600810.SH)：公司拟收购尼龙化工10.27%少数股东股权，交易价格9.52亿 原料药上市公司董秘PK：黄山胶囊张文政成行业“劳模” 年接待投资者520次排名第一官方已经证实 原料药上市公司董秘PK：黄山胶囊张文政成行业“劳模” 年接待投资者520次排名第一最新进展 美团、淘宝、饿了么、京东，集体声明 中药上市公司董秘PK：益佰制药蒋先洪任董秘一年即收获140万年薪显著高于行业均值是真的？ “打飞的”赴港投保再掀热潮，监管提醒这些风险→ 事关国补、内卷式竞争、人工智能+，发改委最新发声 远东宏信发布中期业绩股东应占期内溢利21.64亿元同比增加3.77%又一个里程碑 上海电气：截至7月末累计回购3392.89万股A股股份官方处理结果 鹰美获董事会老大钟育升增持1.6万股每股作价4.06港元 马斯克：实时AI视频渲染技术有望3-6个月实现后续反转 汇盈控股因“10并1”基准进行股份合并而削减22.26亿股实测是真的 信义能源发布中期业绩权益持有人应占溢利4.5亿元同比增加23.43%实垂了 西藏水资源发盈喜预计中期净利润同比增长约300% 保诚7月31日斥资289.49万英镑回购30.16万股 鼎益丰控股：梁炜泰获委任为公司秘书是真的？ 上海实业环境：中期票据获龙国银行间市场交易商协会接受注册官方通报 三生制药完成发行3114.25万股认购股份实时报道 RBC： OPEC+不会增产以抵消俄罗斯遭美国制裁的影响 投资者踊跃申购汇添富上证科创板50成份ETF等多只科技主题基金提前结募是真的？ 暑运过半，全国铁路发送旅客4.41亿人次官方已经证实 隔夜要闻：特朗普下令立即免职劳工统计局局长 ChatGPT付费企业用户超500万特朗普再敦促鲍威尔辞职官方通报 非农数据疲软，特朗普甩锅：拜登任命的官员编制，罢免统计局局长！科技水平又一个里程碑 金价跃升黄金现货上涨2.14%后续反转来了 31省份消费版图：江苏、广东、山东社消零总额超2万亿元官方通报来了 特朗普：下一任劳工统计局局长将是一位“诚实”的人 RBC： OPEC+不会增产以抵消俄罗斯遭美国制裁的影响秒懂 美国债市：短期收益率创一年多最大跌幅交易员料下月九成会降息官方处理结果 上半年地方经济“密码”是真的？ 收盘：非农数据与关税令美股受挫标普指数四连跌 美国原油周五收跌2.8% OPEC或增产引发市场担忧后续反转来了 RBC： OPEC+不会增产以抵消俄罗斯遭美国制裁的影响最新进展 特朗普称“很多优秀人选”可接任劳工统计局局长一职 特朗普称“很多优秀人选”可接任劳工统计局局长一职官方已经证实 隔夜要闻：特朗普下令立即免职劳工统计局局长 ChatGPT付费企业用户超500万特朗普再敦促鲍威尔辞职后续来了

自DeepSeek火爆全球之后，国产开源大模型的开发热潮一浪高过一浪。如今，DeepSeek诞生以来最强的对手，它来了！

今日凌晨3点30，阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布，比DeepSeek更小的尺寸，性能比肩全球最强开源推理模型。据了解，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前，QwQ-32B-Preview已经在（chat.qwen.ai）官网上线。

据通义千问Qwen团队介绍，近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习（RL）对大语言模型的智能的提升作用的最好研究例证。规模上，QwQ-32B是一款仅有320亿参数的模型，其性能却可与具备6710 亿参数（其中370亿被激活）的DeepSeek-R1媲美。

另外，Qwen团队还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。测试结果显示，在测试数学能力的AIME24评测集上，以及评估代码能力的 LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen团队还通过展示了一段简短的示例代码，说明如何通过API使用 QwQ-32B。Qwen团队表示，我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响，阿里巴巴港股大涨6.7%，截稿前报138.6港元，总市值2.63万亿港元。