OpenAI Flex处理模式：费用减半，性能下降

AI资讯1年前 (2025)发布 ainav

182 0 0

4月18日，外媒TechCrunch报道称，在与谷歌等生成式AI竞争对手展开激烈竞争的背景下，OpenAI宣布推出”Flex处理模式”这一全新API服务。该服务允许用户以接受响应速度下降和资源分配不稳定为代价，换取更低廉的价格。

目前，这项Flex处理技术正在对最新发布的o3和o4-mini推理模型进行测试，主要应用于模型评估、数据扩充、异步处理等优先级较低的”非生产环境”任务。

通过采用Flex模式，API使用费用将直接减半。以o3为例，在Flex模式下，服务计费标准为：每百万输入tokens收费5美元（约合人民币36.5元，相当于约75万字），每百万输出tokens收费20美元（约合人民币146元）。

相比标准价格的10美元和40美元，Flex模式费用显著降低。对于o4-mini模型，输入token的单价从1.10美元降至每百万0.55美元（约合人民币4元），输出token的单价则从4.40美元降至每百万2.20美元（约合人民币16.1元）。

在给客户的通知邮件中，OpenAI特别指出，根据用户消费层级的不同，第1至3层的开发者需要完成新近推出的实名认证流程，才能获得o3模型的访问权限。此外，包括流式API服务和推理摘要功能等高级功能，也都要求先完成身份验证。

OpenAI曾明确表示，实施身份验证机制的主要目的是为了防止用户违反公司的使用政策。

文章版权归作者所有，未经允许请勿转载。

ainav

280 0

ainav

272 0

ainav

171 0

ainav

205 0

ainav

217 0

ainav

180 0