日日新 V6.5 —— 商汤科技推出的多模态推理大模型

AI工具1年前 (2025)发布 ainav

279 0 0

日日新 V6.5是什么

日日新 V6.5是由商汤科技最新推出的多模态推理大模型，标志着公司在人工智能领域的又一重要突破。该模型采用了创新的图文交错思维链技术，首次实现了图像以本体形式直接参与推理过程，显著提升了跨模态数据处理的精确度，在与Gemini 2.5 Pro的竞争中展现出明显优势。

相较于前一代的日日新6.0版本，V6.5在核心性能上实现了6.99%的提升，同时大幅降低了30%的推理成本，性价比足足提升了五倍。这一优化使得模型在保持高效性能的同时具备了更低的使用门槛，在多个应用场景中展现出强大的实用价值。

该模型的核心技术优势在于其独特的轻量Vision Encoder+和纵深LLM架构设计。这种创新性结构不仅保证了模型的高效推理能力，更使其能够在自动驾驶、机器人控制等复杂的具身智能场景中发挥出色表现。

多模态推理能力：该模型能够同时处理图像和文本的混合输入，完成复杂的逻辑推理任务。例如，在面对一张图片时，它不仅能准确识别并理解其中的内容，还能结合 accompanying text 提供更精准的描述或回答相关问题。
高效信息整合：得益于创新的图文交错思维链技术，日日新 V6.5能够实现跨模态数据的无缝融合与分析。这种能力使其在处理复杂场景时表现出更高的准确性和更强的适应性。
低资源高效率：相比上一代产品，V6.5显著降低了计算资源消耗，同时保持了性能优势。这一改进使得模型能够更广泛地应用于实际场景中，尤其是在对算力要求较高的领域。