3月9日,国家超算互联网平台宣布正式推出阿里巴巴开源推理模型QwQ-32B的API接口服务,并向用户提供总计100万免费Tokens。
QwQ-32B是阿里巴巴旗下Qwen团队最新推出的开源推理模型,基于优化的Qwen2.5-32B架构,并结合强化学习技术进行训练。根据官方测试结果,在评估数学能力的AIME24评测集和测试代码能力的LiveCodeBench基准下,QwQ-32B的表现与DeepSeek-R1持平,超越了o1-mini等同尺寸模型。
平台方面,国家超算互联网已完成了对QwQ-32B模型的全面优化集成,包括针对vLLM和PyTorch框架的推理支持。用户无需本地下载,即可通过平台一键启动Notebook功能,进行QwQ-32B模型的开发、训练或实现专有数据的私有化部署。
除了提供QwQ-32B模型API接口服务外,国家超算互联网近期还上线了DeepSeek-R1全系列模型及最高671B参数量的满血版AI服务,并提供了丰富的AI Web应用支持。以下是使用QwQ-32B API的具体步骤:
用户登录国家超算互联网商城,进入首页后搜索“QwQ-32B”,点击选择“QwQ-32B接口服务”商品完成购买,随后点击“立即使用”。
访问API信息页面:完成购买后将自动跳转至API详细信息界面。
选择所需调用方式,平台提供了三种接口访问形式:使用Postman、Apifox等HTTP工具;通过Python代码调用;以及在终端直接运行命令行调用。
目前,国家超算互联网已连接国内14个省份的20余家超算和智算中心。平台上现有超过6500款各类算力资源商品,其中AI模型服务近200款,涵盖多种主流深度学习框架和应用场景。
- 1. 国家超算互联网平台
- 2. QwQ-32B模型技术解析
- 3. 深度学习框架API服务
© 版权声明
文章版权归作者所有,未经允许请勿转载。