OpenAI Flex处理模式:费用减半,性能下降

AI资讯2天前发布 ainav
3 0

4月18日,外媒TechCrunch报道称,在与谷歌等生成式AI竞争对手展开激烈竞争的背景下,OpenAI宣布推出”Flex处理模式”这一全新API服务。该服务允许用户以接受响应速度下降和资源分配不稳定为代价,换取更低廉的价格。

目前,这项Flex处理技术正在对最新发布的o3和o4-mini推理模型进行测试,主要应用于模型评估、数据扩充、异步处理等优先级较低的”非生产环境”任务。

通过采用Flex模式,API使用费用将直接减半。以o3为例,在Flex模式下,服务计费标准为:每百万输入tokens收费5美元(约合人民币36.5元,相当于约75万字),每百万输出tokens收费20美元(约合人民币146元)。

相比标准价格的10美元和40美元,Flex模式费用显著降低。对于o4-mini模型,输入token的单价从1.10美元降至每百万0.55美元(约合人民币4元),输出token的单价则从4.40美元降至每百万2.20美元(约合人民币16.1元)。

在给客户的通知邮件中,OpenAI特别指出,根据用户消费层级的不同,第1至3层的开发者需要完成新近推出的实名认证流程,才能获得o3模型的访问权限。此外,包括流式API服务和推理摘要功能等高级功能,也都要求先完成身份验证。

OpenAI曾明确表示,实施身份验证机制的主要目的是为了防止用户违反公司的使用政策。

© 版权声明

相关文章