AI工具
像素猫AI:AI绘画应用,生成吉卜力风格
什么是像素猫AI(Pixcel Cat) 像素猫AI是一款开创性地将吉卜力动画独特魅力与人工智能技术相结合的绘画工具。作为国内首个专注于二次元风格创作的小程序,它...
字节跳动推出AI图像动画框架DreamActor-M1
DreamActor-M1是什么 DreamActor-M1是由字节跳动开发的一款先进的AI图像动画生成框架,它能够将静态的人物照片转化为动态的、生动逼真的视频。该技术通过创新...
北京理工携手多家高校发布:Mini DALL·E 3交互式文生图框架
什么是Mini DALL·E 3 Mini DALL·E 3是由北京理工大学、上海AI实验室、清华大学和香港中文大学共同研发的交互式文本到图像生成框架。该系统能够通过自然语言与...
谷歌推出TxGemma通用医学治疗大模型
深度探索:TxGemma——谷歌在药物发现领域的AI突破 TxGemma是由谷歌推出的革命性通用人工智能模型,专为加速药物研发进程而设计。作为Google的Gemma框架下的重...
基于TripoSG的VAST AI开源高保真三维形体生成技术
TripoSG是什么 TripoSG是由VAST-AI-Research团队开发的先进3D形状生成技术,基于革命性的修正流(Rectified Flow, RF)模型。该系统通过创新的变换器架构、混...
TripoSF:VAST AI开源的3D基础模型
TripoSF介绍 TripoSF是由VAST公司开发的新一代3D基础模型,旨在突破传统3D建模技术在细节表现、结构复杂度和扩展性方面的局限。该模型采用了创新的SparseFlex...
阿里推出的小型深度推理模型
什么是DistilQwen2.5-R1模型 DistilQwen2.5-R1是由阿里巴巴推出的基于知识蒸馏技术的小型化深度推理模型系列。该模型包含3B、7B、14B和32B四个不同参数量级的...
MeshifAI AI 3D模型多类型生成平台
探索MeshifAI:智能文本转3D模型的革新平台 在数字化转型的浪潮中,MeshifAI作为一个创新的AI驱动型3D模型生成平台,正在重新定义内容创作的方式。通过简单的...
飞桨语音工具:百度飞桨团队开发的开源语音处理工具
PaddleSpeech是什么 PaddleSpeech是由百度飞桨团队开发的一款开源语音处理工具,它集成了多种先进的语音处理功能,涵盖语音识别、语音合成、声纹识别以及语音...
ChatAnyone:实时风格化肖像视频生成框架
ChatAnyone是什么 ChatAnyone是由阿里巴巴通义实验室开发的一款创新性实时风格化肖像视频生成系统。该系统能够根据输入的音频信号,自动生成包含丰富表情和上...