阶跃星辰推出最新多模态推理模型

AI工具7小时前发布 ainav
1 0

Step 3是什么

Step 3 是由阶跃星辰最新推出的一款革命性大语言模型,专为下一代推理任务优化设计。该模型采用先进的MoE(混合专家)架构,参数规模达到惊人的321B,其中有效激活参数量高达38B,是目前首个实现全尺寸、原生多模态设计的推理专用模型。Step 3不仅具备卓越的视觉理解能力,更在复杂逻辑推理方面表现出色。

通过创新性的AFD分布式推理系统和MFA注意力机制,Step 3在性能上实现了质的飞跃。特别是在国产芯片平台上,其推理效率相比同类模型提升了三倍;而在NVIDIA Hopper架构芯片上,吞吐量更是提升了超过70%,显著降低了计算成本。

这款划时代的模型将于2024年7月31日正式开源,为全球开发者和企业界提供一个功能强大、性能优越的多模态推理工具。Step 3的推出将极大推动AI技术在多个领域的落地应用。

Step 3的主要功能

  • 视觉感知能力:Step 3能够精准识别和分析图像与视频中的复杂信息,即使在极端环境下也能保持出色的识别效果。例如,在强反光的菜单识别场景中,依然可以准确还原文字内容。
  • 多模态推理能力:作为原生多模态模型,Step 3能够同时处理文本、图像等多种数据类型,并将它们有机融合,从而实现更复杂的逻辑推理任务。
  • 高效推理性能:借助先进的AFD分布式推理系统和MFA注意力机制,Step 3在保持高准确率的同时,显著提升了推理效率。相比同类产品,在国产芯片上的运行速度提升三倍,而在NVIDIA Hopper架构上更是实现了70%以上的吞吐量提升。
© 版权声明

相关文章