4月24日,OpenAI宣布将其全新升级的图像生成功能技术整合到ChatGPT的API服务中,为开发者提供了将该功能集成至自身应用的接口。
今年三月底,OpenAI推出的全新ChatGPT图像生成器因其能制作出高度逼真的吉卜力工作室风格图片和”AI人偶”而备受关注。这一功能吸引了数百万新用户注册使用ChatGPT,并对公司的服务器承载能力提出了严峻考验。据官方统计,在该工具上线首周内,就有超过1.3亿的ChatGPT用户生成了7亿多张图像。
此次开放给API开发者使用的图像生成功能由专为多模态任务设计的”gpt-image-1″模型提供支持。这一原生多模态AI模型能够根据需求生成不同风格和质量的图像。开发者不仅可以同时处理多个图像生成请求,还能通过调节参数控制输出质量和速度。
在安全机制方面,OpenAI为gpt-image-1设定了与ChatGPT图像生成器相同的内容审核标准,即所谓的”安全护栏”,用于过滤不符合内容政策的信息。开发者可以根据实际需求调整审核的严格程度:选择”自动模式”将执行标准过滤;而选择”低敏感度模式”则会放宽部分限制。根据OpenAI提供的技术文档,在”低过滤模式”下,系统对特定年龄段不适宜内容的管控力度相对较小。
值得注意的是,所有通过gpt-image-1生成的图像都将嵌入C2PA(内容创作标记协议)元数据水印。这一功能有助于支持该技术的应用平台和服务识别这些图片是由AI生成的内容。
在收费模式上,gpt-image-1采用按token计费的方式:文本输入每百万token收取5美元,图像输入每百万token费用为10美元,而输出环节的收费标准是40美元/百万token。根据OpenAI的测算,生成不同质量级别的正方形图片成本分别为:
目前,已有Adobe、Airtable、Wix、Instacart、GoDaddy、Canva和Figma等多家知名公司接入或正在测试gpt-image-1服务。例如,Figma的设计平台现已支持用户通过调用gpt-image-1生成并编辑图像;而Instacart则在进行内部测试,尝试将该技术应用于食谱和购物清单的图片生成中。