AI大模型内卷:Grok深夜上线PS功能,与Google Gemini2.0争夺图像编辑市场
近日,AI领域再掀波澜。继Google推出Gemini-2.0-Foundation版本后,另一家科技公司也迅速跟进,在图像编辑功能上展开新一轮竞争。
据消息人士透露,Grok团队在短时间内紧急上线了图片编辑功能,这背后的原因或与Google的”动动嘴”PS功能引发的关注热潮有关。该功能仅需简单的文本指令即可实现复杂的图像编辑操作,例如将两张照片无缝融合、添加人物动作,以及更改服装颜色等。
从Gemini到Grok的技术突破可以看出,当前SOTA模型间的内卷态势愈演愈烈。科技公司们正在通过不断优化AI能力,争夺用户心智份额。未来,人们提起图片编辑时,可能会首先想到由大语言模型提供的便捷功能,而不是传统的Photoshop软件。
这种趋势预示着一场深刻的行业变革:AI技术正在降低图像编辑的技术门槛。借助Gemini和Grok等先进模型,用户只需一句自然语言指令,即可完成高质量的图像编辑,而无需专业的UI设计知识或复杂操作流程。
然而,当前的大模型图像处理能力仍处于”可玩性”阶段,在专业性和精确度方面与传统软件尚有差距。专业人士的图像编辑工作仍然需要依赖专业的设计工具和工程师的操作。
行业专家预测,OpenAI何时推出原生图像生成和编辑功能将成为下一关注焦点。正如阿尔瓦罗·辛塔斯所言:”为什么OpenAI还未发布这一功能?也许很快就会实现。”
这预示着未来的工作方式将发生重大转变:从复杂的操作流程转向简单的交互指令。这种范式转移不仅影响图片编辑领域,还可能重塑整个创意产业的面貌。
参考资料:
https://x.com/dr_cintas/status/1903112910735339984
本文首发于”新智元”微信公众号