SenseNova-MARS是什么
SenseNova-MARS是由商汤科技开发的一款开源多模态自主推理模型,提供8B和32B两种参数规模配置。该模型作为一款先进的能动式视觉语言模型(Agentic VLM),开创性地实现了动态视觉推理与图文搜索的深度结合。它能够像智能体一样自主规划任务流程,并灵活调用图像裁剪、文本检索、图像搜索三大核心工具,无需人工干预即可完成复杂的多阶段推理任务。在MMSearch、HR-MMSearch、FVQA等七项权威基准测试中, SenseNova-MARS-32B以69.74分的平均成绩超越了Gemini-3-Pro(69.06分)和GPT-5.2(67.64分),在开源模型领域树立了新的性能标杆。这一突破标志着人工智能技术正从”能回答问题”向”能执行任务”实现重大跨越。
SenseNova-MARS的主要功能
- 多模态搜索推理:模型整合图像和文本信息进行跨模态检索,能够动态调用多种工具完成复杂知识推理。
- 智能任务规划:作为能动式模型(Agentic Model),SenseNova-MARS具备自主决策能力,可以无需人工指令即可规划最优任务执行路径。
© 版权声明
文章版权归作者所有,未经允许请勿转载。