MHA2MLA:复旦大学、上海AI Lab等提出优化LLM推理效率的新方法
MHA2MLA是什么 MHA2MLA是由复旦大学、华东师范大学及上海AI实验室等顶尖机构联合开发的一种高效微调方法,该技术通过引入DeepSeek的多头潜在注意力机制(MLA...
字节推出Seedream 2.0 AI双语图像生成模型
Seedream 2.0是什么 Seedream 2.0是由字节跳动豆包大模型团队开发的原生中英双语图像生成模型。该系统通过先进的AI技术实现高质量的图像合成与渲染,支持用户...
GaussianAnything:3D生成框架,由新加坡南洋理工S-Lab、上海AI Lab等联合推出
GaussianAnything是什么 作为一种创新的3D生成框架,GaussianAnything由南洋理工大学S-Lab与上海AI实验室等机构联合开发。该技术基于点云结构化潜在空间和级...
BEHAVIOR Robot Suite – 李飞飞团队开源的家庭任务自动化框架
BEHAVIOR Robot Suite概述 BEHAVIOR Robot Suite(简称BRS)是由斯坦福大学李飞飞团队开发的机器人控制框架,专为学习全身操作以执行日常家务任务而设计。该...
由百度飞桨推出的PP-DocBee文档图像理解多模态大模型
PP-DocBee是什么 PP-DocBee是由百度飞桨团队开发的一款专注于文档图像理解的多模态大模型。该模型采用先进的ViT+MLP+LLM架构,特别优化了中文文档处理能力,...
Logome – AI LOGO 设计工具
什么是Logome Logome是一款基于人工智能的在线标志设计平台,专为快速创建专业的品牌形象而打造。通过简单的几步操作,用户就可以利用AI的强大能力生成多个符...
AI数学辅导工具:智能支持手写、语音和图片输入
ThetaWise是什么 ThetaWise 是一款创新性的AI数学辅导工具,专为学生群体设计,旨在帮助他们更高效地掌握数学知识。该平台支持手写输入、语音识别和图片上传...
AI对话训练系统:多模态交互、智能对话模拟
Tough Tongue AI 2.0是什么 Tough Tongue AI 2.0 是一款专为提升多维度沟通能力而打造的智能对话练习工具。它通过模拟各种现实场景,帮助用户在不同情境下磨...
LanDiff:基于混合框架的高质量文本到视频生成技术
什么是LanDiff LanDiff是一项创新性的文本到视频生成框架,它巧妙地结合了自回归语言模型(LLM)与扩散模型的优势,通过独特的分阶段生成机制显著提升了视频...
字节开源COMET:高效低延迟通信优化系统
什么是COMET? 由字节跳动公司独立研发的COMET系统专注于优化混合专家网络架构模型(MoE),旨在解决分布式训练中的通信开销问题。该系统采用创新性计算-通信...