AI工具
AI 助手行动 – 微软新推自动处理重复工作的智能功能
Copilot Actions指的是什么? 在微软举办的 Ignite 大会上发布了 Microsoft 365 Copilot 的新特性——Copilot Actions,该功能允许用户通过简单的指令来自动化...
字节发布MARS框架——旨在提升大模型训练效能
MARS代表的是什么? MARS(让方差缩减大放异彩)是由字节跳动开发的一款创新性优化框架,旨在提高大型模型训练的速度与效率。该框架结合了预条件梯度法和方差...
Documind —— 一款开源的AI文档管理软件,能够把PDF文件转成图片并抽取其中的结构性信息
Documind指的是什么 DocumentPro是一款开源的人工智能文档管理工具,能够从PDF文件中抽取结构化内容。该软件拥有将PDF转为图片、借助OpenAI API进行资料抓取...
验证器工程——中科院、阿里巴巴及小红书共同开发的创新后期培训模式
Verifier工程指的是什么 Verifier Engineering(验证器工程)是由中国科学院、阿里巴巴及小红书共同开发的一种创新后训练方法,旨在为基本模型设计解决提供有...
阿里发布XiYan-SQL – 一款集成了多种生成器的文本转SQL框架
XiYan-SQL指的是什么 阿里巴巴开发了名为XiYan-SQL的自然语言到SQL转换框架,该框架采用了多生成器集成策略,并通过结合提示工程与监督微调技术来提高SQL查询...
阶跃星辰研发的智能视频创作软件 – 跃问视频
跃问视频指的是什么? 阶跃星辰研发的跃问视频是一款AI驱动的多媒体创作工具,涵盖了城市风光、科幻想象、自然景观、超级跑车和美味佳肴等多种创意主题领域。...
EyeDiff – 由文本驱动的图像扩散技术,利用自然语言创建多元眼科学影像
EyeDiff代表的是什么? EyeDiff是一款从文本到图像转换的扩散模型,它依据自然语言提示来创建多模态的眼科影像,以此增强对常见及少见眼部疾病的诊断精确度。...
快手发布的Transformers基础检索架构——KuaiFormer
KuaiFormer指的是什么 KuaiFormer是由快手的技术团队开发的一款基于Transformer架构的检索框架,专门用于大规模的内容推荐体系中。它通过重新构思检索流程,...
ViVo与香港中文大学共同研发的BlueLM-V-3B算法及系统集成设计方案
BlueLM-V-3B指的是什么? BlueLM-V-3B是由vivo AI Lab与香港中文大学MMLab共同研发的一种结合了算法设计与系统架构的创新方法,旨在实现多模态大型语言模型(...
深度求索新发布:DeepSeek-R1-Lite —— 与OpenAI o1-preview比肩的先进AI推断模型
DeepSeek-R1-Lite指的是什么? 深度求索新近发布的AI推理模型DeepSeek-R1-Lite采用强化学习方法进行训练,具备强大的长链思维推理能力,并能够实时展现其思考...