GameGen-X – 香港科技大学携手多家机构开发的互动开放式游戏创作算法

AI工具3个月前发布 ainav
75 0

GameGen-X指的是什么

GameGen-X是由香港科技大学、中国科学技术大学等多个研究机构共同研发的一款扩散变换器模型,专为开放世界游戏视频的内容创作与交互控制而设计。该模型能够模仿游戏引擎的功能特性,包括创建新颖角色、动态场景环境、复杂行为模式以及多样的事件发生等,并允许用户通过文本命令和键盘操作等多种方式来干预游戏内容的生成过程,从而模拟出多样化的游戏体验。GameGen-X利用庞大的OGameData数据集进行训练,展示了其在推动游戏设计与开发方面的巨大潜力。

GameGen-X

GameGen-X的核心特性

  • 制作高水准的游戏视频内容GameGen-X能够创建包含新颖人物、互动场景、精细行为及多样的故事情节片段的开放式游戏录像。
  • 操控互动的能力玩家通过结合结构化的文字指南与键盘操作等多种交互形式,对游戏进行调控,以达成游戏角色之间的交流及游戏环境的实时变化。
  • 游戏机制仿真该模型基于现有的游戏场景来预估并调整后续的发展,以仿真玩家的实际操作与感受。
  • 多种类型数据的整合处理该功能兼容多种输入模式,如文本、视频及键盘操控等,使得内容创作更为灵活多变且丰富多样。
  • 构建数据集合利用OGameData数据集中的资料进行研究,该数据集汇集了逾百万个源自超百款不同游戏的视频剪辑,极大丰富了模型训练所需的材料。

GameGen-X的运作机制

  • 传播转换器架构GameGen-X运用了扩散模型的技术框架,通过逐渐增加噪音来训练系统,并学会反向操作以创造数据。
  • 分步式的培训流程由于提供的原文为空,没有具体内容可以进行伪原创改写。如果您有具体的段落或文章需要处理,请提供详细信息,我将很乐意帮助您完成任务。
    • 初始模型的预先训练通过在文本转视频生成及视频扩展任务上的预先训练,该模型能够创建出长时间且高水准的开放式游戏录像。
    • 指令精细调整通过预先训练的过程,并利用InstructNet模块进行深入训练,达到对生成内容的精准调控。
  • InstructNet组件InstructNet融合了多种与游戏相关的多模态操控信号的专业知识,使模型能够依据用户的输入来调节其潜在表达形式,从而达到对游戏角色交互及场景元素进行一致化管理的效果。
  • 三维空间中的变分自编码器(3D-VAE)该过程旨在通过将视频片段转化为潜在的特征表示来降低数据中的重复信息量,从而加快模型训练的速度。
  • 时间空间扩散变压器的掩模版本(Masked Spatiotemporal Diffusion Transformer, MSDiT)通过整合空间注意、时间注意及交互注意机制,成功创建了受文本提示驱动的游戏视频内容。
  • 多功能智能系统应对各种控制指令,包括结构化的文字信息、来自键盘的操作以及视频指导,以保证所有类型的控制指令都能够得到充分利用。

GameGen-X项目的网址

  • 官方网站项目页面:访问GameGen-X的GitHub页面
  • Git存储库:访问此链接以查看GameGen-X项目仓库 – https://github.com/GameGen-X/GameGen-X
  • 关于arXiv的技术文章在学术资源共享平台arXiv上,有一篇编号为2411.00769的论文可供查阅。

GameGen-X的使用情境

  • 游戏制作及概念设计游戏创作者能够迅速构建游戏雏形,以便检验与确认设计理念,从而在初期研发过程中节省时间和资金。
  • 游戏相关内容制作游戏设计师创造全新的关卡、场景与人物形象,丰富了游戏的内容并增加了多样化的体验。
  • 互动型叙事体验在以互动电影或剧情导向的游戏里,依据玩家的决定即时创造多样化的剧情走向与画面情境。
  • 游戏的检验和仿真游戏测试员会营造多种游戏场景来执行压力检测及提升系统效能。
  • 教育培训于教育行业内,构建模拟的学习空间,使学生能够经由交互式的游戏掌握复杂的理念与技术。
© 版权声明

相关文章