AI工具|第 101 页|AI导航站 - 精选AI工具集合平台

HumanOmni – 阿里通义等推出专注人类中心场景的多模态大模型

HumanOmni是什么 HumanOmni 是专注于人类中心场景的多模态大模型，视觉和听觉模态融合而成。通过处理视频、音频或两者的结合输入，能全面理解人类行为、情感...

AI工具

4个月前

LuminaBrush是什么 LuminaBrush 是用在图像上绘制照明效果的交互式工具。LuminaBrush基于 Flux 文生图项目，用两阶段方法：第一阶段将图像转换为“均匀照明”的...

AI工具

4个月前

ViDoRAG是什么 ViDoRAG是阿里巴巴通义实验室联合中国科学技术大学和上海交通大学推出的视觉文档检索增强生成框架。基于多智能体协作和动态迭代推理，解决传统...

AI工具

4个月前

Spark-TTS是什么 Spark-TTS 是SparkAudio 团队开源的基于大型语言模型（LLM）的高效文本转语音（TTS）工具，无需额外的生成模型，直接从 LLM 预测的编码中重...

AI工具

4个月前

Jobscan是什么 Jobscan 是为求职者设计的简历优化工具，帮助用户提高企业招聘系统（ATS）的概率。Jobscan 基于分析简历与职位描述的匹配度，提供关键词优化建...

AI工具

4个月前

Shandu是什么 Shandu 是开源的 AI 研究自动化工具，结合了 LangChain 和 LangGraph 技术，能自动化地进行多层次信息挖掘和分析，生成结构化的研究报告。Shand...

AI工具

4个月前

Mochii AI是什么 Mochii AI 是多功能的智能AI助手，通过先进的人工智能技术提升用户的生产力和创造力。支持多种高级AI模型，如GPT-4、Claude 3.5和Gemini，能...

AI工具

4个月前

LCVD是什么 LCVD（Lighting Controllable Video Diffusion Model）是四川大学推出的高保真、光照可控的肖像动画生成框架。LCVD基于分离肖像的内在特征（如身...

AI工具

4个月前

CogView4是什么 CogView4 是智谱推出的开源文生图模型，具有60亿参数，支持原生中文输入和中文文字生成。模型在 DPG-Bench 基准测试中综合评分排名第一，达到...

AI工具

4个月前

SepLLM是什么 SepLLM是香港大学、华为诺亚方舟实验室等机构联合提出的用于加速大语言模型（LLM）的高效框架，通过压缩段落信息并消除冗余标记，显著提高了模...

AI工具

4个月前