DeepSeek最强对手来了！阿里巴巴放出重磅炸弹

诺和诺德股价触及四年低点，特朗普敦促美国降低药价 小米应用商店与字节扣子达成合作打通智能体一键发布能力实垂了 龙国银行：9月14日起信用卡逾期诉讼类费用将计入账单首期将先从上海市分行试点后续反转来了 华宝基金胡一江：「红利轮动」在即？“低估值+小市值+高股息”空间可观学习了 #女子穿洛丽塔遭华尔道夫酒店驱赶#上热搜，酒店回应称不清楚 新元科技预重整推进中，索赔案件已递交立案太强大了 #女子穿洛丽塔遭华尔道夫酒店驱赶#上热搜，酒店回应称不清楚 新东方：Q4归母净利暴跌七成，东方甄选“去头部化”阵痛持续后续反转来了 华宝基金胡一江：「红利轮动」在即？“低估值+小市值+高股息”空间可观官方已经证实 招银国际：料AI眼镜热潮利好科技供应链推荐买入小米集团-W等专家已经证实 直击CJ｜踢足球机器人引来围观！加速进化机器人亮相 *ST九有部分案件递交立案，律师提示：符合这些条件可索赔！ 小摩：重申渣打集团“增持”评级目标价148港元最新报道 创意信息旗下万里数据库获评工信部“2024年信息技术应用创新典型应用案例”秒懂 *ST九有部分案件递交立案，律师提示：符合这些条件可索赔！ 机构押注银行股复苏？红利低波ETF（512890）规模突破213亿近20日净流入21亿实时报道 学习了 黄金周报|美联储独立性扰动市场情绪，外盘金价小幅回调这么做真的好么？ 总投资266亿元！在长江上拆旧船闸、再修两条新船闸，长江电力有股东不乐意了？是真的？ 双良节能“氢”装启动官方通报 吴声谈苏超：散装十三太保比赛第一，友谊第十四科技水平又一个里程碑 长期新冠对英国经济的冲击远超其他多数国家 国泰海通证券：当下时点如何看港股新消费？ 马斯克，突发！太强大了 吴声谈小米Yu 7火爆：所有商业模式创新的背后必然是组织创新 老将张成喆转正任行长，西安银行资本充足率A股城商行垫底最新报道 万亿宁德时代与百亿海辰储能恩仇录：2年打4个官司最新进展 8月A股解禁规模超5000亿，芯片头部公司占比高后续反转 海康威视2025年上半年营收净利双增持续推进AI落地千行百业后续来了 市场遭遇夹击！百威亚太上半年净利大跌24.4％，高端领域“腹背受敌”后续反转来了 首创、华鑫、光大等券商密集撤销监事会，审计老大会专业性与独立性成治理焦点实时报道 中金：维持信义能源中性评级升目标价至1.35港元 全国首单获批的数据资产证券化项目成功发行，每日互动率先入池融资专家已经证实 啤酒嘉年华点燃夜经济！2025厦门啤酒消费季思明主场暨思明区仲夏消费季启幕又一个里程碑 创新药深度回调，可以上车吗？高人气520880跌逾3%，溢价高企，近4日吸金6．7亿元这么做真的好么？ 中药股探底回升，陇神戎发一度涨超10% 148只个股连续5日或5日以上获主力资金净买入 喜茶开到苹果总部海外门店数量超100家 突发！上市公司前财务总监被罚！ 军工板块强势拉升，爱乐达20%涨停，长城军工再创新高后续来了 徐勇站上华安-C位-，他要带着这家老基金公司去哪儿？又一个里程碑 爱乐达20CM涨停，低空经济新突破！通用航空ETF华宝（159231）逆市上涨1．73%反转来了

自DeepSeek火爆全球之后，国产开源大模型的开发热潮一浪高过一浪。如今，DeepSeek诞生以来最强的对手，它来了！

今日凌晨3点30，阿里巴巴放出一枚重磅炸弹——通义千问最新开源模型QwQ-32B正式发布，比DeepSeek更小的尺寸，性能比肩全球最强开源推理模型。据了解，通过大规模强化学习，千问QwQ-32B在数学、代码及通用能力上实现质的飞跃，整体性能比肩DeepSeek-R1。而且在保持强劲性能的同时，千问QwQ-32B还大幅降低了部署使用成本，在消费级显卡上也能实现本地部署。

目前，阿里已采用宽松的Apache2.0协议，将千问QwQ-32B模型向全球开源，所有人都可免费下载及商用。同时，用户也将可通过通义APP免费体验最新的千问QwQ-32B模型。目前，QwQ-32B-Preview已经在（chat.qwen.ai）官网上线。

据通义千问Qwen团队介绍，近期的研究表明，强化学习可以显著提高模型的推理能力。例如，DeepSeek-R1通过整合冷启动数据和多阶段训练，实现了最先进的性能，使其能够进行深度思考和复杂推理。而QwQ-32B就是大规模强化学习（RL）对大语言模型的智能的提升作用的最好研究例证。规模上，QwQ-32B是一款仅有320亿参数的模型，其性能却可与具备6710 亿参数（其中370亿被激活）的DeepSeek-R1媲美。

另外，Qwen团队还在推理模型中集成了与Agent相关的能力，使其能够在使用工具的同时进行批判性思考，并根据环境反馈调整推理过程。测试结果显示，在测试数学能力的AIME24评测集上，以及评估代码能力的 LiveCodeBench中，千问QwQ-32B表现与DeepSeek-R1相当，远胜于o1-mini及相同尺寸的R1 蒸馏模型。

在由Meta首席科学家杨立昆领衔的“最难LLMs评测榜” LiveBench、谷歌等提出的指令遵循能力IFEval评测集、由加州大学伯克利分校等提出的评估准确调用函数或工具方面的BFCL测试中，千问QwQ-32B的得分均超越了DeepSeek-R1。

此外，Qwen团队还通过展示了一段简短的示例代码，说明如何通过API使用 QwQ-32B。Qwen团队表示，我们希望我们的一点努力能够证明强大的基础模型叠加大规模强化学习也许是一条通往通用人工智能的可行之路。

受此消息影响，阿里巴巴港股大涨6.7%，截稿前报138.6港元，总市值2.63万亿港元。