MHA2MLA:复旦大学、上海AI Lab等提出优化LLM推理效率的新方法

MHA2MLA是什么 MHA2MLA是由复旦大学、华东师范大学及上海AI实验室等顶尖机构联合开发的一种高效微调方法,该技术通过引入DeepSeek的多头潜在注意力机制(MLA...

字节推出Seedream 2.0 AI双语图像生成模型

Seedream 2.0是什么 Seedream 2.0是由字节跳动豆包大模型团队开发的原生中英双语图像生成模型。该系统通过先进的AI技术实现高质量的图像合成与渲染,支持用户...

GaussianAnything:3D生成框架,由新加坡南洋理工S-Lab、上海AI Lab等联合推出

GaussianAnything是什么 作为一种创新的3D生成框架,GaussianAnything由南洋理工大学S-Lab与上海AI实验室等机构联合开发。该技术基于点云结构化潜在空间和级...

BEHAVIOR Robot Suite – 李飞飞团队开源的家庭任务自动化框架

BEHAVIOR Robot Suite概述 BEHAVIOR Robot Suite(简称BRS)是由斯坦福大学李飞飞团队开发的机器人控制框架,专为学习全身操作以执行日常家务任务而设计。该...

由百度飞桨推出的PP-DocBee文档图像理解多模态大模型

PP-DocBee是什么 PP-DocBee是由百度飞桨团队开发的一款专注于文档图像理解的多模态大模型。该模型采用先进的ViT+MLP+LLM架构,特别优化了中文文档处理能力,...

Logome – AI LOGO 设计工具

什么是Logome Logome是一款基于人工智能的在线标志设计平台,专为快速创建专业的品牌形象而打造。通过简单的几步操作,用户就可以利用AI的强大能力生成多个符...

AI数学辅导工具:智能支持手写、语音和图片输入

ThetaWise是什么 ThetaWise 是一款创新性的AI数学辅导工具,专为学生群体设计,旨在帮助他们更高效地掌握数学知识。该平台支持手写输入、语音识别和图片上传...

AI对话训练系统:多模态交互、智能对话模拟

Tough Tongue AI 2.0是什么 Tough Tongue AI 2.0 是一款专为提升多维度沟通能力而打造的智能对话练习工具。它通过模拟各种现实场景,帮助用户在不同情境下磨...

LanDiff:基于混合框架的高质量文本到视频生成技术

什么是LanDiff LanDiff是一项创新性的文本到视频生成框架,它巧妙地结合了自回归语言模型(LLM)与扩散模型的优势,通过独特的分阶段生成机制显著提升了视频...

字节开源COMET:高效低延迟通信优化系统

什么是COMET? 由字节跳动公司独立研发的COMET系统专注于优化混合专家网络架构模型(MoE),旨在解决分布式训练中的通信开销问题。该系统采用创新性计算-通信...
1 238 239 240 241 242 549