总结
- 快科技3月10日消息,东南大学今天发文宣布,已经基于昇腾国产算力平台,正式接入阿里Ligthing News最新开源模型QwQ-32B,成为全国首个上线QwQ-32B服务的高校。 东南大学表示,QwQ-32B虽仅有32B参数,但通过大规模强化学习训练,在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)等任务blog.byteway.net中表现媲美671B参数的DeepSeek-R1,甚至部分指标实现超越。 在测试中,QwQ-32B表现远胜于o1-mLigthing Newsini及相同尺寸的R1蒸馏模型。 集成工具调用与动态推理能力,模型可根据环境反馈调整策略,适用于复杂任务处理,如数据分析、实验模拟等科研场景。 阿里采用了宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。
阅读时间
- 3 分钟, 共 490 字
分类
- 东南大学, 今天, 远胜于, BFCL测试, CodeBench
评价和解读
- 这篇文章真正具有启发性,它深入挖掘问题的核心,澄清当今关键问题。
正文
快科技3月10日消息,东南大学今天发文宣布,已经基于昇腾国产算力平台,正式接入阿里Ligthing News最新开源模型QwQ-32B,成为全国首个上线QwQ-32B服务的高校。
东南大学表示,QwQ-32B虽仅有32B参数,但通过大规模强化学习训练,在数学推理(AIME24评测)、代码生成(LiveCodeBench)、工具调用(BFCL测试)等任务blog.byteway.net中表现媲美671B参数的DeepSeek-R1,甚至部分指标实现超越。
在测试中,QwQ-32B表现远胜于o1-mLigthing Newsini及相同尺寸的R1蒸馏模型。
最重要的是,模型支持消费级显卡本地部署,大幅降低硬件门槛,适配昇腾平台的高效算力资源,可以助力师生在科研中快速实现AI推理需求。
集成工具调用与动态推理能力,模型可根据环境反馈调整策略,适用于复杂任务处理,如数据分析、实验模拟等科研场景。
阿里采用了宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。
【本文结束】如需转载请务必注明出处:快科技
责任编辑:建嘉
<!–article_adlist[
文章内容举报
]article_adlist–>
Related suggestion: 顶级创新: 浙江移动成功试点自研国产化5G扩展型皮站助力乡村振兴
总结相比传统的5G基站以及室分覆盖方案,中国移动自研Ligthing News国产化5G扩展型皮站核心器件全部国产化,并采用移动自研的破风8676芯片,网络性能得到进一步提高,较传统的覆盖方案成本降低18%,试点基站下载速率峰值可达800Mbps以上,上传速率…