DeepSeek开源最新版R1模型

DeepSeek-R1-0528是什么 DeepSeek-R1-0528是DeepSeek团队最新发布的AI模型版本。该模型基于DeepSeek-V3-0324进行训练,拥有660B的参数量。作为开源模型,Deep...

Largo:基于人工智能的影视数据分析与决策支持平台

什么是Largo Largo是一个基于人工智能技术的影视内容开发加速平台。该平台通过整合分析超过40万部电影和电视剧、95万名演员及5.9万个剧本等海量影视数据,为...

CoGenAV多模态语音表征模型——通义联合深圳技术大学联合推出

CoGenAV介绍与应用 CoGenAV(Contrastive-Generative Audio-Visual Representation Learning)是一款先进的多模态学习模型,专注于音频与视觉信号的对齐与融...

Style Art AI:AI图像创作工具,支持生成多种艺术风格作品

Style Art AI是什么 Style Art AI是一款基于先进人工智能技术的图像生成软件。它结合了最新的ChatGPT 4o模型与多种经典艺术风格,能够将简单的文字描述或现有...

OmniConsistency – 新加坡国立大学推出的图像风格迁移模型

OmniConsistency:重新定义图像风格迁移的新一代模型 在人工智能与计算机视觉领域,图像风格迁移一直是研究热点。新加坡国立大学近期推出的OmniConsistency模...

LMEval:谷歌开源的多模态AI模型评估框架

LMEval是什么 LMEval 是一款由谷歌开发的创新性工具框架,旨在为大型语言模型(LLMs)提供跨平台评估的一站式解决方案。该框架通过整合多种功能模块,帮助开...

LLaDA-V:人大、高瓴AI与蚂蚁集团联合开发的多模态大模型,助力智能应用

LLaDA-V:重新定义多模态大语言模型 LLaDA-V是由中国人民大学高瓴人工智能学院与蚂蚁集团联合推出的最新一代多模态大语言模型(MLLM)。该模型基于纯扩散架构...

剪小映:抖音AI视频剪辑神器,轻松制作创意视频

剪小映是什么 剪小映是一款由抖音官方推出的AI智能视频剪辑工具,专为不具备专业剪辑技能的用户设计。该应用通过先进的AI技术,能够自动解析视频或图片中的场...

Kyutai:低延迟语音交互系统

Unmute是什么 Unmute是由Kyutai公司开发的一款高性能语音交互系统,专注于提供低延迟的语音转文字(Speech-to-Text)和文字转语音(Text-to-Speech)功能。该...

AI视频生成工具:快速将PDF和笔记转换为短视频

什么是MemenomeLM? MemenomeLM是一款由Brainrot AI开发的创新性AI工具,专为Z世代研究人员打造。它能够将PDF文档、笔记等传统学习资料转化为生动有趣的互动视...
1 6 7 8 9 10 391