AI工具
谷歌新推的Project Mariner——一个能够协助用户处理表格和在线购物的智能化网络助手
项目海员指的是什么 谷歌 DeepMind 近期发布了名为 Project Mariner 的浏览器辅助工具。该助手依托于 Gemini 2.0 技术,并以 Chrome 插件的形式实现其功能,...
AI艺术创作工具 —— AISEO Art,涵盖多元场景与丰富的画风技法
AISEO Art指的是什么 AISEO Art是一个由人工智能技术驱动的创新艺术创作平台,利用前沿的人工智能算法,使用户能够通过文本描述来创造独一无二的艺术图像。该...
FLUID – 一种利用流匹配技术的语音引导说话人头部图像生成系统
什么是FLOAT? FLOAT是由DeepBrain AI与韩国先进科技研究院联合开发的一款音频驱动的人物头像动画模型。它采用流匹配技术来构建生成模型,并学习动作的潜在空...
TEN 代理 —— 实时多模态开源AI框架
TEN代理指的是什么 TEN Agent是一款结合了OpenAI实时API与RTC技术的开放源代码即时多媒体人工智能代理架构。它能够支持语音、文字及图像等多种形式的信息互动...
快手携手浙大与清华等多个机构开发的多角度视频创造模型——SynCamMaster
SynCamMaster指的是什么? 由浙江大学、快手科技、清华大学及香港中文大学的研究团队联合研发的SynCamMaster是世界上首个能够生成多角度视频的模型。它利用六...
STIV – 苹果开发的视频创作大型模型
STIV代表的是什么? STIV(可扩展文本与图像条件下的视频生成模型)是由苹果公司开发的一款先进的视频生成功能模块。该模型配备有8.7亿个参数,并能够胜任从...
开源的多语言与多模态模型Maya —— 支持并解析八种不同的语言
什么是Maya? Maya是一款开源的多语言及多模态模型,通过指令微调来增强其在不同文化和语言环境中的应用能力。基于LLaVA架构开发的Maya集成了一个全新的预训...
DiffSensei – 一款能够创造可控制黑白漫画面板的人工智能框架
DiffSensei指的是什么 来自北京大学、上海人工智能实验室以及南洋理工大学的研究团队共同开发了名为DiffSensei的漫画创作系统,该系统能够创建可调控的黑白漫...
谷歌发布的 Project Astra —— 多模态人工智能虚拟助理
项目Astra指的是什么? Astra 项目是由谷歌 DeepMind 开发的一款多模态虚拟助手应用程序,能够在用户的智能手机以及原型眼镜上提供帮助服务,为用户提供一种...
千影 QianYing – 巨人网络开发的音频游戏创作大型模型
千影(QianYing)指的是什么? QianYing是由巨人网络打造的音频游戏生成大模型,该系统包括两个主要组件:面向开放世界的游戏视频生成器YingGame和负责添加配...