展望2025年的人工智能行业,我们可以看到语言智能和空间智能两个领域都呈现出了巨大的潜力。语言智能已经取得了爆发性的发展,而空间智能也初步显示出了引领行业前沿的方向。在未来几年里,世界模型、合成数据和具身智能等技术将成为重要的驱动力,有望加速人工智能从虚拟世界向物理世界拓展,并推动整个AI行业迈上新台阶。
AI新前沿的探索:揭开世界模型的神秘面纱
在最近的12月里,AI行业中出现了一个备受关注的热词——“世界模型”。所谓的世界模型是指AI系统内部用来表达和理解外部世界运行规律的模型,通过大量图像、音频、视频和文本数据进行训练。近期,国内外涌现出了不少令人瞩目的世界模型成果。去年12月初,“AI教母”李飞飞教授在她组建的World Labs发布了一款重磅世界模型;谷歌DeepMind推出了名为Genie 2的新一代世界模型;Meta公司也推出了导航世界模型NWM;此前智源研究院发布了全自主开发的多模态原生世界模型Emu3,成功实现对视频、图像和文本三种形式进行统一理解和生成。
据极佳视界联合创始人兼首席科学家朱政表示,经验丰富的驾驶员在行车过程中能够提前预见到“鬼探头”等情况,这要归功于他们通过规则学习所建立的一种简化的驾驶世界模型。
李飞飞将人类智能归纳为两种主要类型,即语言智能和空间智能。她强调,要使人工智能超越当前的局限性,我们需要发展出具备行动能力的AI。“我们必须从依赖大型语言模型转向拥有广阔世界模型的AI。”她提出。
智源研究院最近发布的2025年十大AI技术趋势指出,为了使AI具备更高级别的认知、适应和决策能力,世界模型技术有望超越传统任务的限制,并开拓人机交互的新领域。李飞飞表示:“解决空间智能问题是至关重要的一步。到2025年,我们很可能会再次突破空间智能的边界。”
数据合成力图突破“数据瓶颈”
数据就像AI大模型的“生命之源”和“能量来源”,其质量和数量直接决定了模型性能的极限。然而,随着大模型的迅猛发展,人们最近不得不面对一个挑战——可供大模型消化吸收的高质量数据变得越来越稀缺。
在最近的一次采访中,马斯克表示,现实世界中可供AI模型训练的数据资源已经所剩无几。多家知名科技杂志如《自然》和《麻省理工科技评论》也指出,传统数据集,这些孕育了无数模型成长的宝贵资源正遭受大语言模型开发者过度“耗竭”。根据人工智能研究机构Epoch AI发布的报告,在2026年之前,AI训练将彻底消耗互联网上包括音视频等高质量数据资源,并且现有真实数据集可能会在2030年至2060年间被完全用尽。
除了“不足”,实际数据世界还存在“低效、无法使用”等情况,数据质量良莠不齐,可能导致模型分析结果出现偏差。与此同时,随着监管力度的加强,对个人信息等数据的保护程度提升,数据获取将受到更为严格的限制。
人工智能领域面临着一个“数据瓶颈”,而合成数据则被视为解决这一问题的良药。所谓合成数据,是指通过计算机算法生成的虚拟数据,而非直接来源于现实世界。“合成数据将在大规模模型迭代和应用推广中发挥重要作用”,智源研究院在其2025年AI技术趋势报告中强调了这一点。
一位专注于自动驾驶的从业者向记者透露,恶劣的天气条件和突然出现在道路上的行人等危险情况,在真实世界中很难收集到足够的数据。因此,我们需要使用合成数据来弥补这一缺失。
智源研究院认为,通过合成数据的方式,可以有效地减少人工治理和标注所需的成本,并且减轻对真实数据的依赖性,从而避免了涉及到数据隐私问题。此外,合成数据还能够缓解通用数据被大公司垄断以及获取专有数据所需的高昂成本等问题,进一步推动大型模型在实际应用中得以落地。
拥有智能体验或迎来突破性的“起始之年”。
在最近举行的国际消费类电子产品展览会(CES)开幕式上,英伟达公司的创始人兼首席执行官黄仁勋表示,通用机器人时代即将来临,这将成为有史以来规模最大的技术产业。他认为,人工智能(AI)未来的发展方向是“物理AI”,其中蕴藏着数万亿美元的商机。
在2024年,全球范围内的具身智能机器人竞争变得越来越激烈。截至去年底,国内已有近100家发布或正在研发人形机器人的厂商,其融资总额已超过100亿元。这场竞争被业界戏称为“百人大战”或“百机大战”。在CES开幕式上,站在黄仁勋身后的14台具身智能机器人中,有6台来自中国。
郭彦东,智平方的创始人兼首席执行官,观点是,在未来的5到10年里,具身机器人将广泛应用于社会生活的各个领域,从高风险工作到重复性任务再到家庭日常生活,并且将重新定义每个行业的运营方式。
根据智源研究院的预测,2025年将标志着具身智能迎来全面发展的新时代。在这一年,众多具身初创企业或许会经历洗牌,行业中的厂商数量也将逐渐减少。从技术角度来看,端到端模型将继续不断改进和演化,“小脑”大模型可能会有突破性进展。而在商业应用方面,更多具身智能技术将被应用于工业场景,并开始实现商业价值。此外,部分人形机器人有望量产并投入市场使用。