浙大携手阿里达摩院打造的视频目标理解及推断技术——VideoRefer

VideoRefer指的是什么? VideoRefer是由浙江大学与阿里达摩院共同研发的一款工具,专注于提升视频内物体的理解与推断能力。该系统利用强化的视频大型语言模型...

麦橘卓越之作 – 基于Flux.1架构的麦橘AI文本转图像技术

麦橘超然指的是什么? 麦橘超然(MajicFlus)是由麦橘公司开发的一款基于Flux.1架构的人工智能图像生成模型,特别注重于创造出高品质的肖像图片,并擅长捕捉...

TIMEWISE – 阿里巴巴通义携手上海交通大学开发出创新的时间序列概要生成架构

CHRONOS指的是什么? TIMEWISE是由上海交通大学计算机科学与工程系及阿里巴巴集团通义实验室等机构共同开发的一款新型框架,旨在通过迭代式的自我提问机制利...

InkAI —— 基于人工智能的纹身设计软件,让您可以预览纹身处於肌肤之上的视觉效果

InkAI代表的是什么? InkAI 是一款利用人工智能技术的创新性纹身设计应用程序,旨在为用户提供个性化的定制化体验。该应用允许使用者挑选多种风格的纹身设计...

AI 重制工具 —— 能够无损放大图片至六倍的智能图像处理器

重录AI是指什么 Retake AI是一款专门用于改善图片质量的智能编辑与修复工具。它运用了人工智能技术,提供了诸如超分辨率放大、低清图像恢复、高效降噪、暗光...

NVIDIA 的 Project DIGITS —— 专为个人打造的AI超级计算机

项目DIGITS指的是什么? NVIDIA 发布了名为 Project DIGITS 的个人AI超级计算机,旨在为从事AI研究的专业人士、数据科学家以及学生提供卓越的计算资源。该设...

蚂蚁集团携手香港科技大学等机构开发的多图一致编辑技术 —— Edicho

Edicho指的是什么 Edicho 是由香港科技大学、蚂蚁集团、斯坦福大学和香港中文大学共同研发的一种基于扩散模型的图像编辑技术,能够实现多幅图片之间的统一修...

检索增强化技术在长视频理解中的应用——VideoRAG

VideoRAG指的是什么? VideoRAG是一种用于处理长视频内容的理解技术,它基于检索增强生成方法(Retrieval-Augmented Generation)。该技术通过从视频中提取与...

自主多模态移动装置代理——Mobile-Agent,利用视觉识别技术推动智能手机的智能操控

什么是移动代理? Mobile-Agent 是一种具备自主迁移能力的智能代理软件形式,在网络的不同节点间穿梭工作,并替用户或其它代理完成特定的任务。它能够在运行...

利用AI轻松创作学术文章 —— 一款能在5分钟内完成原创研究文档的多功能跨学科AI助手

轻量级人工智能学术文章创作是指什么 创新性的人工智能写作工具——轻创AI专为辅助用户高效完成学术文章的撰写而设计。它利用尖端的深度学习技术和大数据分析方...
1 358 359 360 361 362 377