OpenAI推"降速换降价"新服务!模型使用费直接腰斩
4月18日消息,为更强势抗衡谷歌等人工智能公司的竞争,OpenAI宣布推出“弹性处理”(Flex processing)服务。这一新选项通过牺牲响应速度并接受“偶发性资源不可用”,将模型使用成本降低50%。
OpenAI表示,弹性处理服务目前以测试版形式向新发布的o3和o4-mini推理模型开放,主要适用于模型评估、数据富化和异步任务等低优先级“非生产”场景。
根据定价方案,o3模型在弹性处理模式下,每百万输入token(约75万字)费用从标准模式的10美元降至5美元,每百万输出token从40美元降至20美元;o4-mini模型的每百万输入token价格则从1.1美元降至0.55美元,每百万输出token价格从4.40美元降至2.20美元。
在高端人工智能模型成本持续攀升、竞争对手纷纷推出更廉价高效的“经济型”模型之际,OpenAI推出弹性处理服务可谓恰逢其时。本周四,谷歌发布了Gemini 2.5 Flash推理模型,性能相当或超越DeepSeek R1模型,且单位输入token成本更低。
OpenAI在发给客户的电子邮件中提到,OpenAI使用层级体系中的第1至第3层用户(层级由用户在OpenAI服务上的消费金额决定)若要调用o3,必须完成新增的身份验证流程。此外,o3及其他模型的推理摘要功能和流式API支持功能也需通过身份验证后方可使用。
OpenAI先前表示,身份验证旨在防止恶意用户滥用使用政策。(辰辰)
来源: 网易科技报道