近日,谷歌DeepMind团队宣布重大突破——推出全新手语翻译模型SignGemma。这一创新工具能够将手语实时转换为口语化文本,标志着手语翻译技术的新里程碑。作为开放源代码项目,SignGemma计划在未来几个月加入Gemma家族。
值得注意的是,SignGemma目前主要针对美国手语(ASL)和英语进行了优化,但其开源特性为未来的多语言扩展提供了可能。这种开放性将使全球开发者能够根据具体需求对模型进行调整和优化。
DeepMind推出SignGemma的初衷是为了打破手语使用者在沟通方面的障碍,使他们在工作、学习和社交等场景中能够更自如地参与。这一技术将极大提升残障人士的沟通效率。
除了SignGemma,DeepMind今年还推出了另一款重要工具——Gemma 3n模型。该模型支持从音频、图像、视频及文本等多种输入形式生成智能文本,为开发者提供了更大的创作空间,助力打造实时互动应用。
在跨领域合作方面,DeepMind与佐治亚理工学院及Wild Dolphin Project携手推出了DolphinGemma模型。这一项目专注于分析和生成海豚的声音,其研究数据基于对巴哈马大西洋斑点海豚的长期跟踪。
医疗领域也是DeepMind技术的重要应用方向。新加入的MedGemma模型专为医疗AI设计,能够支持临床推理和医学影像分析,推动了人工智能在医疗服务中的创新应用。
© 版权声明
文章版权归作者所有,未经允许请勿转载。