AI工具
Vidnoz – 线上智能视频创造工具,拥有超过1200个高度真实的AI人物模型
Vidnoz指的是什么 Vidnoz 是一款卓越的在线AI视频创作工具,凭借其众多的虚拟人物形象、高级的声音合成技术及多种多样的预制视频模版,使用户能够便捷高效地...
中科院研发的低延时高音质语音互动模型——LLaMA-Omni
LLaMA-Omni代表的是什么? 中国科学院计算技术研究所与中国科学院大学的研究团队发布了一种新的架构——LLaMA-Omni,旨在提供与大型语言模型(LLM)进行快速且...
ANTO —— Windows桌面字幕翻译开源软件
ANTO代表什么? ANTO是一款面向Windows平台的开源桌面软件,专注于SRT格式字幕文件的翻译工作。它兼容包括谷歌翻译、DeepL、微软翻译、百度翻译及有道翻译在...
AiNiee —— 专为游戏发烧友与小说拥趸打造的AI翻译助手
AiNiee指的是什么? AiNiee是一款基于人工智能的便捷翻译软件,能够一键完成RPG游戏对话、SLG策略游戏说明以及Epub和TXT格式的小说等各类文件的自动化翻译任...
RAG-SFR – 一款侧重于上下文理解与检索加强生成的语义模型
SFR-RAG指的是什么? Salesforce AI Research开发了名为SFR-RAG的大规模语言模型,旨在增强机器在文本理解与生成方面的效能。该模型尤为注重精准把握语境,并...
基于QA-MDT的高性能文本生成音乐开源项目OpenMusic
OpenMusic指的是什么? OpenMusic 是一个利用 QA-MDT(Quality-aware Masked Diffusion Transformer)技术打造的高端文字转音乐模型。通过前沿的人工智能算法...
OneweBot2 – 点击即用的微信AI助手安装包,轻松启动exe即可体验
onewebot2指的是什么? OneBotPro是一款用于微信的AI机器人软件包,它允许用户只需下载并双击exe文件就能启动程序,省去了繁琐的Python环境设置步骤。该软件...
GOT-OCR2.0 – 一款开放源代码的全栈式 OCR 解决方案,支持多种语言与模式识别,并具备灵活的输入输出选项
GOT-OCR2.0指的是什么? GOT-OCR 2.0代表了光学字符识别(OCR)领域的最新进展,引领这项技术迈入了新的阶段。该端到端的系统由一个高效压缩编码器和一个支持...
中科大开发的AI人像视频编辑软件 – PortraitGen
PortraitGen指的是什么 由中国科学技术大学的研究团队开发的PortraitGen是一款先进的AI人像视频处理软件。该工具运用了3D高斯溅射技术及神经网络驱动的纹理生...
字节跳动发布的新款AI视频创作工具豆包Seaweed —— 采用Transformer架构设计
豆包Seaweed指的是什么 豆包Seaweed是一款由字节跳动开发的人工智能视频创建工具,具备文本转视频和图像转视频的功能。该模型采用Transformer架构,并通过时...