Muse指的是什么
Microsoft近日发布了一款名为Muse的创新型人工智能模型,专用于游戏创作领域,并基于“World and Human Action Model”(WHAM)构建而成。该系统能够创造逼真的游戏角色动作与视觉场景,通过分析大量的人类玩家行为数据(如屏幕截图和操作记录),来模拟出符合实际游玩体验的游戏序列。Muse的核心功能在于生产连贯且统一的虚拟环境、呈现多样化的发展路线,并能将用户的个性化修改无缝集成到生成的内容之中。借助WHAM Demonstrator提供的交互平台,Muse支持创作者进行游戏设计上的探索与优化迭代工作。Microsoft已经公开了Muse的模型参数和样本数据集,旨在促进研究界对AI辅助游戏创意开发的兴趣和技术进步,同时也为未来的智能驱动型游戏创作奠定基础。
Muse的核心特性
- 创造流畅的游戏画面与操作体验基于起始的游戏界面与控制操作输入,创建持续几分钟的连续 gameplay 序列,模仿实际游戏中的动态变化。
- 提供多种游戏路线选择在同样的起始条件下,创造出多样的游戏体验与视觉风格,以体现广泛的行为和视效变化。
- 保存用户的更改把玩家对于游戏视觉元素的调整(比如增加人物角色)整合到新创建的游戏内容里,并设计出连贯的进一步游玩方式。
- 创新的不断演进支持借助WHAM Demonstrator平台,使用者可以导入起始图像、修改生成的内容,并通过操控器指导人物行动,从而迅速推进创意的发展与更新。
Muse的工作机制
- 矢量量化生成对抗网络该技术应用于将游戏视觉元素,比如游戏画面,转化为分离式的表达形式。VQ-GAN利用量化方法把图片转变成一系列可识别的符号(即令牌),从而使模型能够更有效地进行处理。
- 变换器结构该模型的核心架构是Transformer,它被用来预估后续的符号。此架构能够应对分离式的视觉与动作序列,并识别这些序列间的多重关联性。
- 自动回溯创造该模型依据提供的起始线索(比如最初的屏幕图像或是控制指令)来逐阶段地构建连续的画面与操控流程。每一个步骤的结果都会参考之前的信息,以保证整个过程中的画面和操作既顺畅又统一。
- 培训资料Muse利用来自《Bleeding Edge》游戏中用户的操控与视觉信息来完成培训工作。这套系统接收用户对控制器的操作以及相应的游戏图像作为输入,并通过分析这些资料学会创建全新的游戏片段。
Muse项目的网址
- 官方网站项目访问链接 https://www.microsoft.com/en-us/research/blog/announcing-the-launch-of-muse 可以了解到最新的项目发布信息。
- HuggingFace的模型集合:访问微软在Hugging Face上的WHAM模型仓库: https://huggingface.co/microsoft/wham
- 科技文章访问此链接以查看文章的内容:https://doi.org/10.1038/s41586-025-08600-3
注意,上述DOI(数字对象标识符)实际上指向与原链接相同的文章页面。由于版权保护的原因,我无法直接改写或复制文章的具体内容。不过,提供的链接可以帮助您找到原始资料。
Muse的使用情境
- 探索游戏创新思路迅速创建游戏机制与层级布局,协助开发人员测试新颖想法。
- 自动化的游戏检测创建多种测试序列,以发现游戏中的缺陷并提升用户体验。
- 信息创作通过自动创建独特的关卡、地形及人物动作来增加游戏的多样性。
- 游戏玩家行动预见通过模仿玩家的操作来分析其行为特征,并据此改进游戏的设计。
- 由人工智能赋能的体验设计互动式情节与人工智能竞争者,增强游戏的独特性和玩家沉浸体验。
© 版权声明
文章版权归作者所有,未经允许请勿转载。