小红书推出社交大模型:RedOne

AI工具1个月前发布 ainav
47 0

RedOne是什么

RedOne是小红书推出的首款专为社交网络服务领域设计的定制化大语言模型(LLM)。该模型采用了独特的三阶段训练策略,在注入社交文化知识的同时,强化了多任务处理能力,并对齐平台规范与用户偏好。经过优化后,RedOne在八个核心社交任务上的性能平均提升了14.02%,并且在双语评测基准测试中成绩提高了7.56%。此外,RedOne在有害内容检测方面表现出色,成功将有害内容的曝光率降低了11.23%;同时,在浏览后搜索功能上显著提升了用户的点击页面率,增幅达到14.95%。这些数据充分证明了RedOne在社交领域中的卓越性能和广泛应用前景。

小红书推出社交大模型:RedOne

RedOne的主要功能

RedOne具备多项核心功能,为社交平台提供了强大的支持。首先,它能够对用户生成的内容进行分类、主题识别和意图分析,帮助平台更好地管理和推荐内容。其次,RedOne可以从非正式的社交帖子中提取结构化信息,例如预测标签、回答问题以及检测关键词汇,这对内容聚合和知识图谱构建具有重要意义。

在语义匹配方面,RedOne能够准确判断用户查询与社交笔记之间的语义关联性,并提供精准的相关性评估。此外,RedOne还能模拟用户的浏览行为,基于用户的浏览历史生成后续的搜索建议,进一步提升用户体验。

值得注意的是,RedOne还支持对话和角色扮演功能,可以在情感陪伴对话和群聊中表现出色,为用户提供更丰富的互动体验。在多语言环境下,RedOne能够实现笔记翻译,并成功保留原文的情感和语气。同时,RedOne在有害内容检测方面表现优异,有效降低了平台上的安全风险;而在浏览后搜索优化上,则显著提升了用户点击页面的概率,增强了内容的发现能力。

RedOne的技术原理

RedOne采用了创新的三阶段训练策略,确保模型在社交领域的卓越性能。第一阶段是继续预训练(Continue Pretraining, CPT),这一阶段通过整合大规模高质量语料库和社交网络数据,覆盖了非正式讨论、短评论、讽刺语句等多种社交沟通模式。研究人员采用了精心设计的数据筛选流程,剔除低质量数据并优化数据分布,在此基础上基于Qwen2.5模型进行继续训练。

第二阶段是监督微调(Supervised Fine-Tuning, SFT)。在这个过程中,研究团队通过构建真实用户生成内容的任务集,定义了包括内容理解、信息提取和语义匹配等在内的六种核心能力,并将这些能力映射到具体应用场景中。采用双步训练策略,首先在大规模通用数据和社交数据混合的基础上进行初步微调,随后逐步增加社交数据的比例,进一步优化模型在关键任务上的表现。

第三阶段是偏好优化(Preference Optimization, PO)。这一阶段通过利用隐性偏好信号,使模型输出更符合人类的期待和平台规范。针对不同类型的任务(主观性和客观性),研究人员设计了差异化的偏好对构建策略,并邀请领域专家进行标注和数据扩展。基于直接偏好优化(DPO)算法,RedOne能够有效学习用户的偏好信号,从而生成更加符合用户预期的内容。

在整个训练过程中,RedOne采用了通用领域数据与社交领域数据的混合策略,在增强模型特定领域适应性的同时,也保留了其在通用领域的强大能力。这种平衡设计使RedOne在面对未见过的任务(Out-of-Domain, OOD)时仍能保持良好的泛化性能。

RedOne的项目地址

  • 技术论文链接:https://www.arxiv.org/pdf/2507.10605

RedOne的应用场景

RedOne在社交网络服务领域展现了广泛的应用潜力。首先,在有害内容检测方面,RedOne能够有效识别和过滤包括仇恨言论、虚假信息和色情暴力等内容,从而显著提升平台的安全性和用户体验。

其次,浏览后搜索优化是RedOne的另一大应用场景。通过分析用户的浏览历史和行为特征,RedOne可以生成更精准的内容推荐和搜索建议,帮助用户发现更多感兴趣的内容,同时增强其与平台之间的互动频率。

在内容理解和分类方面,RedOne能够自动对用户生成的内容进行准确分类和深度理解,这不仅有助于平台更好地管理和推荐内容,也为社交网络的智能化运营提供了有力支持。此外,在信息提取功能上,RedOne可以从非正式的社交帖子中高效提取关键信息,例如标签、重点词汇和事实数据,这对于内容聚合和知识图谱构建具有重要意义。

最后,语义匹配是RedOne在社交搜索中的重要应用之一。通过评估用户查询与社交笔记之间的语义相关性,RedOne能够提供更精准的搜索结果和推荐内容,从而提升用户体验并优化平台的内容分发效率。

© 版权声明

相关文章