DELIFT —— 高效数据驱动的语言模型指令精调方法

104 0 0

DELIFT代表的是什么？

DELIFT（Data Efficient Language model Instruction Fine-Tuning）是一种创新的算法，旨在通过优化大型语言模型（LLMs）在指令调整、特定任务微调和持续性微调三个关键环节中的数据选择来提升效率。该技术利用成对效用评估与次模优化方法挑选出多样化且最优的数据子集，在减少计算资源使用的同时保持或增强模型的性能表现。实验结果表明，DELIFT能够将所需用于微调的数据量降低70%，显著节约了计算成本，并在效果上超越现有的同类解决方案。

DELIFT的核心特性

数据挑选精进：通过系统性地改进数据挑选流程，降低大规模语言模型（LLMs）精细调整时对数据的需求量，同时确保或进一步提高其效能。
适用于多个阶段：在进行精细调整时涉及的三大核心步骤包括：指示优化、针对具体任务的调整以及连续性优化，并且需要根据各个步骤的特点来制定专门的数据挑选方案。
提高计算效能：防止使用耗费大量资源的操作，比如完整的梯度计算，从而使算法能够更有效地处理大规模的数据集合与模型。
突破当前的方法：与当前的数据选取技术相比，其在效率和性能方面均有明显改进，提升了大约26%的效果。

DELIFT的核心技术机制

配对实用评估：关键在于配对效益测量（pairwise utility metric），它用于评定一个数据实例在提升模型处理其它实例表现方面的作用大小，从而有效地量化了该数据实例相对于现有模型性能的知识重要性。
次模函数优化：利用次模函数选取数据子集的方法能够确保所选样本既多样又富含信息，并避免冗余，这是因为次模函数具备边际效益减少的特点。
个性化配置的亚模函数：依据各个精细调整的不同阶段，选用适宜的次模函数，例如设备定位（DL）、设备定位交互信息（DLMII）以及设备定位条件收益（DLCG），以满足命令优化、任务定制化精调及连续性微调的具体要求。
贪心策略：通过应用贪心策略逐步形成数据的小集合，在此过程中每一次选取均旨在为已选定的次模函数贡献最大的边缘效益的数据元素。
模型响应整合：结合成对效用评估和次模函数优化技术，依据模型现有能力及短板挑选最具价值的数据样本，以提升其在特定任务中的表现。