OpenAI于2025年1月31日正式发布了其最新的推理模型o3-mini,并向所有用户免费开放。这是OpenAI推理系列中最经济高效的模型,现已集成到ChatGPT和API中。o3-mini在2024年12月首次亮相,其“满血版”o3模型也将在不久后推出。OpenAI声称,o3模型在推理能力上超越了现有的o1模型,尤其在编程、数学和科学等理工科问题上表现突出。 o3-mini的一大特色是可以调整“AI推理努力程度”,分为低、中、高三个级别,允许开发者根据需求平衡准确性和速度。测试结果显示,在AIME 2024测试中,o3-mini在低努力程度下准确率与o1-mini相当,但在中等和高努力程度下准确率分别达到79.6%和87.3%,显著高于o1-mini。在博士级科学问题(GPQA Diamond)测试中,o3-mini的准确率也随着努力程度的提高而提升,最高达到79.7%。在Frontier Math和Codeforces等编程竞赛中,o3-mini也展现出显著优势。此外,o3-mini在通用知识问答中的表现也优于o1-mini。 与o1-mini相比,o3-mini在保证同等智能水平的同时,速度更快,效率更高。在A/B测试中,o3-mini的响应速度比o1-mini快24%,平均响应时间为7.7秒,而o1-mini为10.16秒。延迟方面,o3-mini的首个token平均比o1-mini快2500毫秒。与DeepSeek-R1模型相比,o3-mini在AIME 2024和GPQA Diamond测试中的表现也具有竞争力。有专家指出,OpenAI可能受到了DeepSeek的影响,开始展示推理模型的思维过程。 对于付费用户,o3-mini将取代o1-mini成为默认模型,并提升了速率限制。ChatGPT Plus和Team用户每日可用次数从50次提升到150次,ChatGPT Pro用户则可以无限制使用o3-mini。
前言:了解小轿车折旧的重要性在汽车生命周期中,折旧是一个不可避免...
腾讯混元推出五款全新开源3D生成模型及升级版AI创作引擎3月18...
近年来,区块链技术发展日新月异,其应用领域不断拓展,同时也面临着诸多...
高尔夫汽车后排灯的关闭方式及注意事项,是车主日常用车中容易忽视却十分...
迈腾后座安全关闭的方法及注意事项迈腾作为一款备受欢迎的汽车,其后...