OpenAI于2025年1月31日正式发布了其最新的推理模型o3-mini,并向所有用户免费开放。这是OpenAI推理系列中最经济高效的模型,现已集成到ChatGPT和API中。o3-mini在2024年12月首次亮相,其“满血版”o3模型也将在不久后推出。OpenAI声称,o3模型在推理能力上超越了现有的o1模型,尤其在编程、数学和科学等理工科问题上表现突出。 o3-mini的一大特色是可以调整“AI推理努力程度”,分为低、中、高三个级别,允许开发者根据需求平衡准确性和速度。测试结果显示,在AIME 2024测试中,o3-mini在低努力程度下准确率与o1-mini相当,但在中等和高努力程度下准确率分别达到79.6%和87.3%,显著高于o1-mini。在博士级科学问题(GPQA Diamond)测试中,o3-mini的准确率也随着努力程度的提高而提升,最高达到79.7%。在Frontier Math和Codeforces等编程竞赛中,o3-mini也展现出显著优势。此外,o3-mini在通用知识问答中的表现也优于o1-mini。 与o1-mini相比,o3-mini在保证同等智能水平的同时,速度更快,效率更高。在A/B测试中,o3-mini的响应速度比o1-mini快24%,平均响应时间为7.7秒,而o1-mini为10.16秒。延迟方面,o3-mini的首个token平均比o1-mini快2500毫秒。与DeepSeek-R1模型相比,o3-mini在AIME 2024和GPQA Diamond测试中的表现也具有竞争力。有专家指出,OpenAI可能受到了DeepSeek的影响,开始展示推理模型的思维过程。 对于付费用户,o3-mini将取代o1-mini成为默认模型,并提升了速率限制。ChatGPT Plus和Team用户每日可用次数从50次提升到150次,ChatGPT Pro用户则可以无限制使用o3-mini。