3月24日,深度求索公司官方消息显示,其DeepSeek-V3智能模型已完成一次小范围更新。用户可前往该公司的官网、应用程序或小程序体验此次升级版本(注:新版本已关闭深度思考功能),API接口和调用方式与之前保持一致。
此次升级的具体内容尚未对外公开。据资料显示,DeepSeek-V3模型于去年12月正式发布,并随即宣布开源。该模型基于深度求索公司自研的多专家并行(MoE)架构构建,包含6710亿参数量,在多项权威评测中超越了包括Qwen2.5-72B和Llama-3.1-405B在内的诸多开源项目,并在性能表现上与当前全球顶尖的闭源模型GPT-4系列及Claude-3.5-Sonnet等产品达到了同等水平。
值得一提的是,今年1月深度求索公司还推出了全新的DeepSeek-R1推理模型,并将其源代码对外公开。该产品在性能指标上与OpenAI的GPT-1正式版看齐,凭借其显著的成本优势和卓越的运行效率,在全球范围内迅速引发关注并获得广泛认可。
© 版权声明
文章版权归作者所有,未经允许请勿转载。