O3 et o4-mini : révolution des intelligences artificielles par OpenAI

OpenAI 最近的创新，体现于 o3 和 o4-mini ，标志着人工智能领域的 *重大革命*。这些模型旨在进行复杂推理，超越用户的期望，提供无与伦比的能力。它们的 *推理回答* 能力为创新的实际应用开辟了新的道路。

OpenAI 将这些模型定位为 *应对当代挑战的解决方案*，使许多先前的系统变得过时。科技与人工智能的交集在此达到了未曾探索的巅峰，推动着朝着主动智能的愿景前进。

o3 和 o4-mini：革命性的人工智能模型

OpenAI 最近揭晓了两个革命性的模型：o3 和 o4-mini。这些模型展示了人工智能推理领域的显著进步。它们旨在应对具体使用案例，在复杂性和分析能力上远远超过之前的模型。

顶尖性能和分析能力

o3 在 STEM （科学、技术、工程、数学）基准测试中表现出色。该模型在多个类别中建立了 SOTA 分数，特别是在 Codeforces 上以多模态表现出 82.9% 的分数。

在视觉推理方面，o3 超越了其前辈，在 MathVista 测试中取得了令人印象深刻的 86.8% 的分数，该测试旨在评估对图像和图表的理解。o4-mini 模型则表现出相对竞争力，具有明显更有利的成本和执行速度。

模型比较

o4-mini 在特定测试中的结果，如 AIME 2024，表现突出。它在该数学比赛中取得了 93.4% 的分数，甚至超过了 o3。尽管在一些复杂任务中表现稍逊，如多轮指令追踪，但其性价比依然极具吸引力。

总体而言，o3 和 o4-mini 能够处理各种使用案例，从编码问题到复杂的视觉分析。OpenAI 设计这些模型以便在实际操作环境中提供适当且合乎逻辑的响应。

模型的成本和财务可及性

OpenAI 定价 o3 和 o4-mini 模型，使其在反映价值的同时也变得可获取。o3 的输入费用为 每百万个 tokens 10 美元，而 o4-mini 的费用仅为 1.10 美元，这种定价使得获取先进的人工智能资源变得更加容易。

在输出方面，o3 的定价为每百万个 tokens 40 美元，而 o4-mini 则为 4.40 美元。这些价格展示了在技术创新和经济机会之间进行平衡的意愿。

Codex CLI：一种新的自主代码代理

与 o3 和 o4-mini 模型同时推出的还有 Codex CLI，这是一个专门用于编程的人工智能代理。该程序是开源的，不仅可以读取和修改代码，还可以在不同的机器上执行代码。

Codex CLI 默认通过 API 使用 o4-mini，使其具有很大的使用灵活性。用户特别欣赏它在无需将完整代码传输给模型的情况下，与关键数据进行交互的能力，从而提升了操作的安全性和效率。

未来展望：o3-pro

OpenAI 计划即将推出 o3-pro，一个更高效的模型。这一新版本预计将更进一步突破推理的极限，并持续加速 AGI 的演进。通过 o3 和 o4-mini，OpenAI 正在朝着具有重大影响的人工智能解决方案迈出重要步伐。

在警觉的框架下，公司已采取了强有力的安全措施，过滤高达 99% 的敏感对话，以预见风险。这种主动的方法突显了 OpenAI 构建可靠且安全的模型的承诺。

这些创新反映了人工智能的快速发展，展示了像 OpenAI 这样的公司如何塑造明日的科技格局。它们的能力承诺深刻地改变分析流程，从而在科学和技术等多个领域创造新的机会。

有关 o3 和 o4-mini 的常见问题：OpenAI 的人工智能模型

什么是 o3 和 o4-mini 模型？
o3 和 o4-mini 模型是由 OpenAI 开发的人工智能系统，旨在通过多模态推理能力进行高级推理和解决复杂任务。

使用 o3 模型与 o4-mini 相比，主要优势是什么？
o3 模型在各种基准测试上提供顶尖性能，特别是在视觉推理和多模态分析方面，而 o4-mini 虽然有效且成本较低，但在某些领域的表现稍微逊色。

OpenAI 是如何设计 o3 和 o4-mini 模型以满足具体使用案例的？
OpenAI 特别训练 o3 和 o4-mini 模型，使其有效使用网络搜索工具和 Python 分析，能够处理各种实际和复杂的使用案例。

o3 和 o4-mini 的成本差异是什么？
o3 模型的输入费用为每百万个 tokens 10 美元，输出费用为 40 美元，而 o4-mini 模型的输入费用更为实惠，为 1.10 美元，输出费用为 4.40 美元。

Codex CLI 是什么，如何与 o3 和 o4-mini 模型一起工作？
Codex CLI 是一个开源的人工智能代理，允许读取、修改和执行代码。它主要与默认的 o4-mini 模型配合使用，但也可以通过 OpenAI 的 API 使用其他模型。

o3 在哪些基准测试中表现优于 o4-mini？
o3 模型在 Codeforces 和 SWE-bench 等基准测试中建立了领先的分数，超越了 o4-mini 在视觉推理等领域的表现。

OpenAI 如何确保在使用 o3 和 o4-mini 模型时的安全性？
OpenAI 已实施强有力的安全机制，包括过滤 99% 的敏感会话的监控系统，以最小化使用这些模型所带来的潜在风险。

哪里可以获取 Codex CLI 的源代码？
Codex CLI 的源代码可在 GitHub 上获得，用户可以安装并在其机器上使用，尤其是在 macOS 和 Linux 下。

即将推出的 o3-pro 版本预期有什么改进？
即将发布的 o3-pro 版本预计将提供更先进的推理能力，进一步突破人工智能的性能和应用界限。

o3 和 o4-mini : OpenAI 迄今为止公布的最先进的人工智能模型

o3 和 o4-mini：革命性的人工智能模型

顶尖性能和分析能力

模型比较

模型的成本和财务可及性

Codex CLI：一种新的自主代码代理

未来展望：o3-pro

有关 o3 和 o4-mini 的常见问题：OpenAI 的人工智能模型

一些路人被一個過於誠實的人工智能廣告牌震驚

Apple 開始從德克薩斯州發運一款旗艦產品

在盧浮宮的飛行：由其攝影師解讀的病毒性照片之謎，介於福爾摩斯與人工智能之間

一間創新的公司，尋求擁有清晰和透明價值觀的員工

Microsoft Edge : 由 Copilot 模式所改變的瀏覽器，人工智能為您的瀏覽提供服務！

欧盟：针对美国大型科技巨头的审慎监管

o3 和 o4-mini : OpenAI 迄今为止公布的最先进的人工智能模型

o3 和 o4-mini：革命性的人工智能模型

顶尖性能和分析能力

模型比较

模型的成本和财务可及性

Codex CLI：一种新的自主代码代理

未来展望：o3-pro

有关 o3 和 o4-mini 的常见问题：OpenAI 的人工智能模型

.tdi_114{z-index:84546!important}Apple 開始從德克薩斯州發運一款旗艦產品

.tdi_133{z-index:84546!important}在盧浮宮的飛行：由其攝影師解讀的病毒性照片之謎，介於福爾摩斯與人工智能之間

.tdi_152{z-index:84546!important}一間創新的公司，尋求擁有清晰和透明價值觀的員工

.tdi_171{z-index:84546!important}Microsoft Edge : 由 Copilot 模式所改變的瀏覽器，人工智能為您的瀏覽提供服務！

.tdi_190{z-index:84546!important}欧盟：针对美国大型科技巨头的审慎监管

Apple 開始從德克薩斯州發運一款旗艦產品

在盧浮宮的飛行：由其攝影師解讀的病毒性照片之謎，介於福爾摩斯與人工智能之間

一間創新的公司，尋求擁有清晰和透明價值觀的員工

Microsoft Edge : 由 Copilot 模式所改變的瀏覽器，人工智能為您的瀏覽提供服務！

欧盟：针对美国大型科技巨头的审慎监管