4月17日消息,北京时间今日凌晨,OpenAI发布了两款突破性AI模型,它们能够通过图像进行推理,并可独立使用工具,专家称它们为人工智能能力的一次飞跃。
这两款新模型分别被称为o3与o4-mini,它们都是OpenAI “o系列” 推理模型的最新成员,并被称为迄今为止最智能、最强大的模型。这些系统能将图像直接整合到推理过程中,并在单一任务流程中执行网页搜索、代码运行、文件分析乃至图像生成等操作。
OpenAI总裁格雷格·布罗克曼(Greg Brockman)在发布会上表示:“有些模型会让人觉得像是迈入未来的质变,GPT-4就是其中之一。今天也将成为这样的历史时刻。这是首批让顶尖科学家都承认能产出确实优秀、实用新颖创意的模型。”
这些新模型最显著的特征是“图像思维”能力。它们不仅是识别图像,还能在问题解决流程中操控并推理。
OpenAI在声明中强调:“它们不只是看图——而是用图像进行思考。这解锁了一类全新的问题求解方式,将视觉与文本推理相融合。”
在发布会演示环节,研究人员展示了o3如何分析一份来自十年前实习项目的物理海报:它能独立解析其中复杂的图示,甚至识别出海报本身未呈现的最终结论。
OpenAI多模态推理研究员布兰登·麦肯锡(Brandon McKenzie)在演示中说道:“它相当于在几秒内为我阅读了至少10篇不同的论文。”他估计,这项任务如果由他本人完成,“光是重新熟悉当年的项目背景就要好几天,然后可能还得几天才能完成文献查阅。”
人工智能在推理过程中操控图像的能力,比如放大细节、旋转图像或裁剪冗余元素等,被行业分析师认为可能彻底改变从科研到教育等多个领域。
沃顿商学院研究人工智能、创新与创业公司的伊森·莫里克教授(Ethan Mollick)在社交平台上发文称:
我获得了o3的早期使用权限,这款模型令人印象深刻,能力非常强大。以下为一些有趣的示例:
超越AI模型:o3与o4-mini如何通过先进工具集成作为完整AI系统运行
OpenAI的高管强调,这次发布的不仅仅是推理模型的升级版本,而是完整的人工智能系统,它们能够在解决问题时独立调用并串联多个工具。
该公司在发布声明中表示:“我们通过强化学习训练模型使用工具——不仅让它们学会如何使用工具,更让它们学会何时使用工具。”
布罗克曼特别强调了这些模型在工具调用方面的强大能力:“它们实际上是在思维链中调用这些工具,以尝试解决困难问题。例如,我们曾看到o3为了解并执行一个极其困难的任务,连续调用了大约600次工具。”
这种能力使模型能够执行复杂的、多步骤的工作流任务,而无需用户持续介入。比如,当被问到“加州未来的能源使用趋势”时,人工智能系统可以搜索公用事业数据、编写Python代码进行分析、生成可视化图表,并撰写出一份全面的报告——所有步骤都作为一个流畅、连贯的过程完成。
OpenAI宣称,o3在多个关键人工智能能力基准测试中确立全新行业标杆,包括Codeforces(编程竞赛平台)、SWE-bench(软件工程基准)和MMMU(多模态理解评估)。
据外部专家评估,在复杂现实任务中,o3的重大错误率较前代模型降低20%。
而轻量级模型o4-mini在保持强大推理能力的同时,更注重速度与成本效益。配备Python解释器时,其在2025年AIME数学竞赛中取得99.5%的惊人准确率。
OpenAI研究负责人马克·陈(Mark Chen)在发布会上说道:“我真的相信,凭借这套模型组合,o3和o4-mini,我们将会看到更多的突破。”
OpenAI发布新模型的时机也非常关键,该公司在两天前刚刚推出了GPT-4.1模型,该模型在编程任务中表现优异。接连不断的发布表明,OpenAI在竞争激烈的人工智能领域正在加速推进,并面临来自谷歌Gemini、Anthropic Claude以及埃隆·马斯克(Elon Musk)旗下xAI等日益激烈的竞争压力。
上个月,OpenAI完成了历史上最大规模的私募融资,筹集了400亿美元资金,估值达3000亿美元。另外,该公司还在考虑构建自己的社交网络,可能对标马斯克的X,并确保拥有独立的训练数据源。
新模型在软件工程领域的表现特别出色。布罗克曼在发布会上提到,o3在“检索OpenAI内部代码库时的表现比我还要出色,这真的很有用。”
作为此次发布的一部分,OpenAI还推出了Codex CLI,这是一款轻量级的编程智能体,可以直接在用户的终端运行。这个开源工具让开发者能够利用这些模型的推理能力来完成编程任务,支持截图和草图输入。
OpenAI在公告中写道:“我们还分享了一个新的实验:Codex CLI,一个可以从终端运行的轻量级编程智能体。通过将截图或简略草图传递给模型,并结合对本地代码的访问,用户可以从命令行获得多模态推理的好处。”
为了鼓励采用,OpenAI启动了一项100万美元的扶持计划,支持使用Codex CLI和OpenAI的模型,每个项目将获得2.5万美元的API信用额度。
OpenAI首席执行官山姆·奥特曼(Sam Altman)发帖称:“由于o3和o4-mini在编程领域表现优异,OpenAI还推出了一个新产品——Codex CLI,旨在简化它们的使用。这是一款运行在你计算机上的编程智能体,完全开源,并已于今日发布;我们预计它将迅速改进。”
OpenAI表示,已对新模型进行了广泛的安全测试,特别是针对它们拒绝有害请求的能力。该公司的安全措施包括完全重建安全训练数据,并开发了系统级的缓解措施来标记危险的提示。
OpenAI在公告中称:“我们对这两个模型进行了迄今为止最严格的安全测试。o3和o4-mini在生物学、网络安全和AI自我改进能力等领域的潜在风险,仍然低于OpenAI的高风险阈值。”
在发布会上,OpenAI两位研究人员展示了详细的基准测试结果,并指出新模型在训练计算量上超过了以往版本的10倍,才能实现这些强大的能力。
此次发布对OpenAI来说是一个重要的商业机会,因为这些模型似乎比前代更强大且更具成本效益。该公司举例称,在2025年AIME数学竞赛中,o3的性价比严格优于o1。同样,o4-mini在成本表现上也优于o3-mini。
业内分析人士认为,这些发布是人工智能能力融合的更广泛趋势的一部分,模型越来越多地将专业推理与自然对话能力和工具使用结合起来。
OpenAI在发布会中指出:“最新发布反映了我们的模型发展方向:我们正在将o系列的专门推理能力与GPT系列更多的自然对话能力和工具使用结合起来。”
随着人工智能领域的竞争日益加剧,谷歌、Anthropic等公司推出越来越强大的模型,OpenAI在推理能力和实际工具使用上的双重关注表明,其战略是旨在通过提供智能和实用性来保持领先地位。
通过o3和o4-mini,OpenAI已经跨越了一个门槛——机器开始像人类一样感知图像,将视觉信息的处理作为思维过程的组成部分,而不仅仅是分析它们所看到的。这种从被动识别到主动视觉推理的转变,可能比任何基准分数都更具意义,代表着人工智能终于开始通过“思考的眼睛”来看待世界。(小小)
时事1:纬来体育在线日,成都国际班列中越(成都-越南)冷链班列首发,形成两大中心:就是将总部建设成为酿造中心和文化休闲中心。在继续发展和巩固全球最大的酿造中心地位同时,美化和改造总部环境,建设好博物馆,打造文化休闲中心。,线日,文化氤氲正当时,
石飞蛟的胸口光芒闪耀,那张陈旧的古兽皮竟与他的胸膛融合在一起,化作了他的肉皮,散发出强大的生机,开始绽放璀璨的光辉,最后结出一个神秘的符号。
04月08日,开机率断崖式下跌,电视机如何重回客厅“C位”?,金色战矛向前刺去,洞穿天地,诸神的吟唱响起,是如此的真实,神圣无比,光辉洒落,这是以攻代守!,188宝金博赌场网站,betway官网体育,捕鱼app下载。
04月08日,学习·故事丨见证40余年中国情缘 习颁授他“001”号奖章,
山地一片赤红,有很多水洼,都是血,肉泥与白骨茬儿更是到处都是,血腥气扑鼻。
04月08日,莫言编剧、王可然执导话剧《鳄鱼》在苏州首演,最后,让我们再次用热烈的掌声,对国家验收组和省、市档案局领导给予我们的关心和支持,表示感谢!,K8凯发官网地址,银河国际直营,pg电子模拟器试玩在线:太阳城备用网址
反复强调:“如果没有铁的纪律,党就会成一盘散沙。”按要求,在这次地方党委集中换届中,中央、省、市机关和组织部门,都就严肃换届中的组织人事纪律,重申了刚性要求。刚才,代表县委宣布的“六不准”,与中央、省、市的要求是完全一致的。全县广大干部,尤其是领导干部,一定要增强政治观念、组织观念、法纪观念,坚持社会主义荣辱观,正确对待自己、正确对待组织、正确对待与自己相处的,讲党性、讲道德、讲正气、讲人格,带头严格遵守组织人事工作纪律。必须强调,在执行纪律上,县委的态度是旗帜鲜明的,无论是普通,还是领导干部,凡是违反换届工作纪律,该函询的函询,该诫勉谈话的诫勉谈话,该查处的严肃查处。希望全县每一位都以党的事业为重、以人民利益为重,多一点奉献心、少一点名利心,千万不能做违背组织意图、伤害感情、影响自身形象的蠢事,千万不能做拉票或抬高自己、贬损他人之类的丑事。做蠢事、丑事,轻则会使自己失去组织的信任、在群众中留下不良影响,重则会使自己受到党纪的严惩、身败名裂,而对党的事业、对个人的发展都是百害而无一利的。总之,要通过严肃纪律,努力营造一个风清气正的换届环境,确保县委换届,换出正气、换出团结、换出干劲、换出发展。
最后,一群人又望向了老柳树,村落这么神秘,这株柳树扎根在这里,也一定很非凡吧?
【西方秘密调查“北溪”爆炸 真正破坏者却从未被曝光】【国际商事仲裁理事会发布第二版《纽约公约》释义指南】