8月13日,商汤科技联合创始人、执行董事兼首席科学家林达华在8月12日发表了一篇深度文章《迈向多模态通用智能:商汤的思考》,深入探讨了发展多模态智能的重要意义。
林达华在文章中指出,人工智能的核心目标是通过计算来实现智能。而智能是一个复杂的多维度概念,其核心在于自主交互能力,包括感知、推理、决策和学习等多方面的综合能力。
他进一步强调,语言只是人类智能演进过程中的一个产物,并非智能的本质。语言是描述世界的工具,但并非世界本身。林达华明确表示:“仅依赖于语言模型无法实现真正意义上的通用人工智能(AGI)。”
林达华指出,大语言模型是向AGI迈进的重要一步,但随着现有文本语料的逐渐被AI消耗殆尽,人工智能的下一阶段突破必然要超越语言,回归智能的本质——与世界的交互。
他认为,若想让人工智能具备通用性,则必须使其像人类一样通过感官接收信息,并将原始模态数据转化为可计算的内部表征。他强调:“多模态信息感知与处理能力是AGI的核心要求,也是从语言模型向AGI发展的必经之路。”
林达华的文章不仅揭示了多模态通用智能的发展逻辑和技术路径,还展望了其未来的实践探索和应用方向,为人工智能领域提供了新的思考维度。
© 版权声明
文章版权归作者所有,未经允许请勿转载。