4月16日,谷歌宣布将旗下Veo 2视频生成AI模型向Gemini Advanced订阅用户提供。这一决策是为了应对OpenAI的Sora视频生成平台带来的竞争压力,并在快速发展的市场中抢占先机。值得注意的是,在此两周前,合成媒体领域的另一强劲对手Runway刚刚推出了其第四代视频生成器,并成功融资超过3亿美元(约合人民币21.93亿元)。
从本周二起,Gemini Advanced用户可在谷歌 Gemini 应用程序的模型下拉菜单中选择Veo 2。用户能够利用该模型生成时长8秒、分辨率为720p、宽高比为16:9的视频片段,并通过 Gemini 的“分享”功能将这些视频上传至TikTok、YouTube等平台。此外,Veo 2生成的视频可下载为带有谷歌SynthID技术水印的MP4文件。尽管如此,目前该功能仍有限制,包括每月可创建的视频数量上限以及暂时不支持谷歌 Workspace 的商业和教育计划。
谷歌还将其实验性工具Google Labs的Whisk与Veo 2进行了整合。Whisk允许用户将图片用作Gemini的提示词来生成新图片,而新增的Whisk Animate功能则能将静态图片转化为由Veo 2生成的8秒短视频。值得注意的是,Google Labs目前仅向每月支付20美元订阅费的Google One AI Premium用户提供访问权限。
虽然当前Veo 2的应用场景仍较为基础,但谷歌DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)表示,公司正计划将Gemini AI模型与Veo技术相结合,以增强其对物理世界的理解能力。
然而,像Veo 2这样的视频生成工具的普及也引发了艺术家和创作者的担忧。这类工具可能对创意产业带来颠覆性影响。根据好莱坞动画师和漫画家工会(Animation Guild)委托进行的一项2024年研究预测,到2026年,AI技术可能导致美国电影、电视和动画领域超过10万个就业岗位面临风险。