自我扩展——阿里千问开发的增强输出长度的迭代训练架构

AI工具2年前 (2025)发布 ainav

416 0 0

自我延伸指的是什么？

Self-Lengthen是由阿里巴巴千问团队开发的一种创新迭代训练架构，旨在增强大型语言模型（LLMs）在生产较长内容方面的性能。该框架采用了两个角色——生成器与扩展器进行协作：首先由生成器创建初步的回答，随后扩展器对这些回答进行分解并进一步延伸以形成更长的文本输出。这一流程通过不断迭代逐步提升模型处理较长文本的能力。Self-Lengthen架构利用现有的LLMs知识和技能，无需依赖额外的数据或特定模型，从而有效弥补了在训练过程中生成长文时可能遇到的问题。

Self-Lengthen的核心特性

增加文字数量使得大语言模型能够产生比常规训练技术更为延长的文字内容。
维持文章的质量在增加文字篇幅的过程中，确保并增强产出内容的一致性和关联度。
不必提供更多的信息无需借助外在的数据资源或是专属的模型，依靠自身固有的知识与能力。
反复训练通过迭代流程逐步增强模型在处理较长文本时的表现能力。
机动性适用于各种复杂的长篇内容创作任务，涵盖文学编写与科学研究等领域。

自我延伸技术的工作机制

创造者（Creator）与拓展者（Expander）由于提供的内容仅有冒号，并没有实际的文字信息供我进行伪原创的改写，请提供具体的内容以便于我能更好地帮助您。如果您有特定的主题或者句子需要改写，请一并告知。
- 创建工具：承担创建初步简短文字回复的任务。
- 放大器使用生成器产生的结果作为新的输入源，进一步拓展成更长的文章内容。
反复的培训流程由于提供的内容为空，没有具体文字可供改写。如果有具体的段落或句子需要进行伪原创的处理，请提供详细信息。这样我可以帮助您完成需求。
- 通过持续的迭代过程，逐渐提升生成器与扩展器在处理较长文本方面的效能。
- 在每个迭代过程中，扩展模块努力延长生成模型所产生的内容，并利用这些加长的内容来优化生成模型，使其能够直接产出更加冗长的文字。
命令扩展通过运用自我指导的技术来扩展和增加训练指令的多样性，可以更有效地引领模型创作出较长的文字内容。
分步扩充技术由于提供的内容仅有冒号，并没有实际的文字信息需要进行伪原创的改写，所以无法完成请求的操作。如果有具体的段落或句子，请提供详细的内容以便更好地帮助您。
- 首个阶段：扩增装置放大了生成器产出物的初始段落。
- 第二个阶段利用第一阶段的扩充成果来引导其余部分的拓展，从而完成整篇文档的内容扩充。
调整模型参数通过利用扩充技术对生成器和扩充模块进行优化调整，以支持在未来的发展周期内创建更为冗长的内容。
品质管理通过运用规则体系与评价方法来保障长时间文本创作的质量，并防止出现冗余及缺乏实质内容的扩张。