o3 和 o4-mini : OpenAI 迄今为止公布的最先进的人工智能模型

Publié le 19 4 月 2025 à 10h03
modifié le 19 4 月 2025 à 10h03

OpenAI 最近的创新,体现于 o3 和 o4-mini ,标志着人工智能领域的 *重大革命*。这些模型旨在进行复杂推理,超越用户的期望,提供无与伦比的能力。它们的 *推理回答* 能力为创新的实际应用开辟了新的道路。

OpenAI 将这些模型定位为 *应对当代挑战的解决方案*,使许多先前的系统变得过时。科技与人工智能的交集在此达到了未曾探索的巅峰,推动着朝着主动智能的愿景前进。

o3 和 o4-mini:革命性的人工智能模型

OpenAI 最近揭晓了两个革命性的模型:o3o4-mini。这些模型展示了人工智能推理领域的显著进步。它们旨在应对具体使用案例,在复杂性和分析能力上远远超过之前的模型。

顶尖性能和分析能力

o3 在 STEM (科学、技术、工程、数学)基准测试中表现出色。该模型在多个类别中建立了 SOTA 分数,特别是在 Codeforces 上以多模态表现出 82.9% 的分数。

在视觉推理方面,o3 超越了其前辈,在 MathVista 测试中取得了令人印象深刻的 86.8% 的分数,该测试旨在评估对图像和图表的理解。o4-mini 模型则表现出相对竞争力,具有明显更有利的成本和执行速度。

模型比较

o4-mini 在特定测试中的结果,如 AIME 2024,表现突出。它在该数学比赛中取得了 93.4% 的分数,甚至超过了 o3。尽管在一些复杂任务中表现稍逊,如多轮指令追踪,但其性价比依然极具吸引力。

总体而言,o3 和 o4-mini 能够处理各种使用案例,从编码问题到复杂的视觉分析。OpenAI 设计这些模型以便在实际操作环境中提供适当且合乎逻辑的响应。

模型的成本和财务可及性

OpenAI 定价 o3 和 o4-mini 模型,使其在反映价值的同时也变得可获取。o3 的输入费用为 每百万个 tokens 10 美元,而 o4-mini 的费用仅为 1.10 美元,这种定价使得获取先进的人工智能资源变得更加容易。

在输出方面,o3 的定价为每百万个 tokens 40 美元,而 o4-mini 则为 4.40 美元。这些价格展示了在技术创新和经济机会之间进行平衡的意愿。

Codex CLI:一种新的自主代码代理

与 o3 和 o4-mini 模型同时推出的还有 Codex CLI,这是一个专门用于编程的人工智能代理。该程序是 开源 的,不仅可以读取和修改代码,还可以在不同的机器上执行代码。

Codex CLI 默认通过 API 使用 o4-mini,使其具有很大的使用灵活性。用户特别欣赏它在无需将完整代码传输给模型的情况下,与关键数据进行交互的能力,从而提升了操作的安全性和效率。

未来展望:o3-pro

OpenAI 计划即将推出 o3-pro,一个更高效的模型。这一新版本预计将更进一步突破推理的极限,并持续加速 AGI 的演进。通过 o3 和 o4-mini,OpenAI 正在朝着具有重大影响的人工智能解决方案迈出重要步伐。

在警觉的框架下,公司已采取了强有力的安全措施,过滤高达 99% 的敏感对话,以预见风险。这种主动的方法突显了 OpenAI 构建可靠且安全的模型的承诺。

这些创新反映了人工智能的快速发展,展示了像 OpenAI 这样的公司如何塑造明日的科技格局。它们的能力承诺深刻地改变分析流程,从而在科学和技术等多个领域创造新的机会。

有关 o3 和 o4-mini 的常见问题:OpenAI 的人工智能模型

什么是 o3 和 o4-mini 模型?
o3 和 o4-mini 模型是由 OpenAI 开发的人工智能系统,旨在通过多模态推理能力进行高级推理和解决复杂任务。

使用 o3 模型与 o4-mini 相比,主要优势是什么?
o3 模型在各种基准测试上提供顶尖性能,特别是在视觉推理和多模态分析方面,而 o4-mini 虽然有效且成本较低,但在某些领域的表现稍微逊色。

OpenAI 是如何设计 o3 和 o4-mini 模型以满足具体使用案例的?
OpenAI 特别训练 o3 和 o4-mini 模型,使其有效使用网络搜索工具和 Python 分析,能够处理各种实际和复杂的使用案例。

o3 和 o4-mini 的成本差异是什么?
o3 模型的输入费用为每百万个 tokens 10 美元,输出费用为 40 美元,而 o4-mini 模型的输入费用更为实惠,为 1.10 美元,输出费用为 4.40 美元。

Codex CLI 是什么,如何与 o3 和 o4-mini 模型一起工作?
Codex CLI 是一个开源的人工智能代理,允许读取、修改和执行代码。它主要与默认的 o4-mini 模型配合使用,但也可以通过 OpenAI 的 API 使用其他模型。

o3 在哪些基准测试中表现优于 o4-mini?
o3 模型在 Codeforces 和 SWE-bench 等基准测试中建立了领先的分数,超越了 o4-mini 在视觉推理等领域的表现。

OpenAI 如何确保在使用 o3 和 o4-mini 模型时的安全性?
OpenAI 已实施强有力的安全机制,包括过滤 99% 的敏感会话的监控系统,以最小化使用这些模型所带来的潜在风险。

哪里可以获取 Codex CLI 的源代码?
Codex CLI 的源代码可在 GitHub 上获得,用户可以安装并在其机器上使用,尤其是在 macOS 和 Linux 下。

即将推出的 o3-pro 版本预期有什么改进?
即将发布的 o3-pro 版本预计将提供更先进的推理能力,进一步突破人工智能的性能和应用界限。

actu.iaNon classéo3 和 o4-mini : OpenAI 迄今为止公布的最先进的人工智能模型

一些路人被一個過於誠實的人工智能廣告牌震驚

des passants ont été surpris en découvrant un panneau publicitaire généré par l’ia, dont le message étonnamment honnête a suscité de nombreuses réactions. découvrez les détails de cette campagne originale qui n’a laissé personne indifférent.

Apple 開始從德克薩斯州發運一款旗艦產品

apple débute l’expédition de son produit phare fabriqué au texas, renforçant sa présence industrielle américaine. découvrez comment cette initiative soutient l’innovation locale et la production nationale.
plongez dans les coulisses du fameux vol au louvre grâce au témoignage captivant du photographe derrière le cliché viral. entre analyse à la sherlock holmes et usage de l'intelligence artificielle, découvrez les secrets de cette image qui a fait le tour du web.

一間創新的公司,尋求擁有清晰和透明價值觀的員工

rejoignez une entreprise innovante qui recherche des employés partageant des valeurs claires et transparentes. participez à une équipe engagée où intégrité, authenticité et esprit d'innovation sont au cœur de chaque projet !

Microsoft Edge : 由 Copilot 模式所改變的瀏覽器,人工智能為您的瀏覽提供服務!

découvrez comment le mode copilot de microsoft edge révolutionne votre expérience de navigation grâce à l’intelligence artificielle : conseils personnalisés, assistance instantanée et navigation optimisée au quotidien !

欧盟:针对美国大型科技巨头的审慎监管

découvrez comment l'union européenne impose une régulation stricte et réfléchie aux grandes entreprises technologiques américaines, afin de protéger les consommateurs et d’assurer une concurrence équitable sur le marché numérique.