AgentGen – 由微软与香港大学共同开发的旨在增强大型AI模型规划功能的架构

112 0 0

AgentGen代表的是什么

AgentGen是由香港大学与微软共同开发的一款AI项目框架，它通过自动构建多样化的环境及挑战来显著增强大型语言模型（LLM）的计划制定能力。借助BI-EVOL技术手段，该项目生成了一系列逐步增加难度的任务集，在某些测试中使得拥有80亿参数的Llama-3模型的表现接近GPT-4的标准。AgentGen在跨领域和非传统任务上的评估均显示出优秀的性能，并预期未来将在机器人操控、智能家居系统等需要复杂规划的应用场景中发挥作用。

AgentGen的核心特性

构建灵活的环境配置该系统具备独立设计和生成多种虚拟场景的能力，为智能体提供了广阔多样的互动空间。
个性化智能任务设置凭借高级的语言模型技术，AgentGen可以智能化地量身打造任务，并创建出具备高度适应性的操作环境。
自适应难度调整借助创新的BI-EVOL方法，该系统可以灵活地改变任务的挑战级别，助力智能体在从简单到复杂的各类任务中逐步学习与进步。
不必使用海量的训练样本AgentGen的零样本生成功能降低了对海量训练数据集的要求，并加速了模型培训流程。
精确技能提升借助对指令的精细调整，该系统能有效地增强智能体执行具体任务的技术水平，并提高它们处理问题的效率。
全方位性能监控AgentGen利用精细的性能评价系统，使得智能体在多种任务中的执行效果达到最佳。

AgentGen的核心技术机制

创建情境AgentGen借助大型语言模型（LLM）创建包含状态空间、动作空间及转换函数描述的环境规格，并利用代码生成方法具体化这些环境的编程实现。
基于启发式的准则与语言数据库于环境构建阶段，AgentGen借助启发性准则及丰富的数据资源引导LLM创造多样的环境场景。
作业创建在构建出特定场景后，AgentGen利用大型语言模型创建与其相符的任务计划，并保证这些任务能够很好地适应所设定的场景。
BI-EVOL技术方案AgentGen运用了双向进化(BI-EVOL)策略来调控作业的难易程度，这一过程涉及将作业简化(easy-evol)及增加其复杂性(hard-evol)，从而构建出一系列逐步提升难度的任务集合。
无样本训练于任务创建的起始环节，AgentGen运用零样本学习技术引导LLM产出一系列初步计划任务。
命令精细调整AgentGen运用指令微调方法，借助生成的轨迹信息（由动作与观测值组成的序列），来优化大型语言模型的规划技能。
效能评价AgentGen利用诸如成功比率和进展比率等标准来衡量模型在执行规划任务时的性能，以保证训练过程的有效性。