火速适配国产算力!阿里Qwen3全家桶上线超算互联网:支持企业级部署

内容摘要快科技4月29日消息,今日,阿里云正式开源Qwen3系列模型,参数量为DeepSeek-R1的1/3,成本大幅下降。今晚,国家级算力服务平台超算互联网宣布,平台火速上线Qwen3全家桶,包含六个Dense模型:Qwen3-32B、Qwen3

快科技4月29日消息,今日,阿里云正式开源Qwen3系列模型,参数量为DeepSeek-R1的1/3,成本大幅下降。

今晚,国家级算力服务平台超算互联网宣布,平台火速上线Qwen3全家桶,包含六个Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B;以及两款MoE模型:Qwen3-235B-A22B(2350多亿总参数、 220多亿激活参数),Qwen3-30B-A3B(300亿总参数、30亿激活参数)。

Qwen3系列模型采用Apache2.0协议开源,开发者、企业可在超算互联网下载模型文件进行快速开发。

超算互联网表示,平台即将上线Qwen3系列模型镜像、应用空间快速体验服务,无需安装依赖,用户可0代码体验Qwen3系统模型对话服务,实现云端开箱即用。

据介绍,Qwen3-235B-A22B在编码、数学、通用能力等基准评测中表现出竞争力,能够与DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等模型媲美。

此外,小型MoE模型Qwen3-30B-A3B以激活参数数量的10倍优势超越了QwQ-32B,Qwen3-4B小型模型也能匹敌Qwen2.5-72B-Instruct的性能。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:拾柒

 
举报 收藏 打赏 评论 0
今日推荐
浙ICP备19001410号-1