三星的迷你 AI 模型超越了强大的推理 LLMs

Publié le 9 10 月 2025 à 09h20
modifié le 9 10 月 2025 à 09h21

三星的微型AI模型动摇了既定的信念。面对数字巨头大型语言模型,一个灵感闪现出来。一个仅有700万个参数的紧凑网络挑战了巨头的统治,证明了复杂推理可以在没有庞大资源的情况下出现。微型递归模型(TRM)体现了这一范式转变,重新定义了现代人工智能的轮廓。在困难基准测试中表现惊人,这一壮举引发了一个基本问题:大小真的代表力量吗?

微型递归模型的显著进展

三星最近揭示了一项颠覆性的研究,关于一个微型AI模型——微型递归模型(TRM),挑战了大型语言模型(LLMs)的先入之见。TRM仅有700万个参数,代表了当前市场上最大模型的不到0.01%。该模型在被视为复杂的基准测试上展示了卓越的表现,如智能测试ARC-AGI。

替代大规模方案的方法

在人工智能行业的普遍趋势中,往往优先考虑规模而非效率。科技巨头们投入数十亿美元创造更大的模型。然而,三星的亚历克西亚·朱利科尔-马丁诺的研究探讨了一条替代路径,强调了TRM带来的前所未有的效率。该模型的设计挑战了强大模型必须依赖于大规模的假设。

在复杂推理中的卓越表现

TRM的主要优势之一在于其以极高的精度进行复杂和多步骤推理的能力。与顺序生成回答的LLMs不同,TRM通过对问题的理解进行迭代来适应其推理。这一过程使其在面对常因复杂推理开始时生成的错误而变得不那么脆弱。

一种效率惊人的模型

TRM的核心是一个简单的神经网络,提升其内部推理和所提议的回答。在考虑一个问题、初始假设和一个潜在推理特征时,该模型进行迭代并细化其回答。这种方法允许最多进行16轮改进,促进对错误的动态恢复。

切实的结果和显著的影响

结果显示相较于以往模型有显著改善。例如,在极限数独数据集上,TRM达到了87.4%的准确率,而其前身层次推理模型(HRM)为55%。在困难迷宫挑战中,TRM也取得了85.3%的得分,超过了HRM。

促进效率的简化方案

TRM的设计还集成了一个自适应机制,称为ACT,它决定了何时是切换到新数据样本的最佳时机,从而简化训练过程。这一变化消除了对第二次通过的需求,而不会影响模型的最终泛化能力。

质疑AI标准的模型

三星提出的这项研究引发了对快速扩展的AI模型当前方向的质疑。通过设计能够推理和自我纠正的架构,我们能够用通常所需资源的一小部分,面对极其复杂的问题。人工智能的竞赛可能会朝着在效率与性能间达成一致的方向发展。

要了解更多关于人工智能领域的进展和学习机会,建议关注如AI与大数据博览会等重大活动,该活动将在阿姆斯特丹,加利福尼亚和伦敦举行。

关于三星微型AI模型的常见问题解答

三星微型AI模型的工作原理是什么?
三星微型AI模型,称为微型递归模型(TRM),使用单一小型网络架构来递归地提高其推理和回答,同时仅有700万个参数,这使其比大型模型更高效。

TRM模型与传统LLMs有何区别?
TRM专注于利用内部推理对回答进行迭代改进,而不仅仅是简单生成文本,这使得它在复杂推理任务中成功,而没有大型模型的缺陷。

TRM模型超越了哪些基准测试?
TRM模型在极限数独基准测试中达到了87.4%的精度,并在诸如ARC-AGI等智能测试中超越了其他模型,包括大型LLMs。

为什么TRM模型在资源方面比其他模型更高效?
通过采用更紧凑的架构并避免复杂的数学论证,TRM需求的训练数据更少,减少了过拟合的风险,因此以更少的资源提供令人印象深刻的结果。

递归如何提高了模型的性能?
递归使模型能够在最终回答之前多次修订其推理,这提高了其预测的准确性,纠正了整个过程中的潜在错误。

TRM模型中的自适应ACT机制有何重要性?
ACT机制决定模型何时已经足够改善一个答案以切换到新数据示例,从而在不需要通过网络进行额外代价高昂的传递的情况下使训练过程更高效。

为什么网络的大小会影响过拟合?
像TRM这样的小型模型,通常趋向于更好地泛化,因为它们不太可能仅适应小数据集的特性,从而降低了过拟合的风险。

这个模型对人工智能和LLMs的未来有何影响?
TRM模型的成功质疑了大型模型始终是最佳解决方案的观点,并为以更经济和高效的方式解决复杂人工智能问题铺平了道路。

actu.iaNon classé三星的迷你 AI 模型超越了强大的推理 LLMs

一些路人被一個過於誠實的人工智能廣告牌震驚

des passants ont été surpris en découvrant un panneau publicitaire généré par l’ia, dont le message étonnamment honnête a suscité de nombreuses réactions. découvrez les détails de cette campagne originale qui n’a laissé personne indifférent.

Apple 開始從德克薩斯州發運一款旗艦產品

apple débute l’expédition de son produit phare fabriqué au texas, renforçant sa présence industrielle américaine. découvrez comment cette initiative soutient l’innovation locale et la production nationale.
plongez dans les coulisses du fameux vol au louvre grâce au témoignage captivant du photographe derrière le cliché viral. entre analyse à la sherlock holmes et usage de l'intelligence artificielle, découvrez les secrets de cette image qui a fait le tour du web.

一間創新的公司,尋求擁有清晰和透明價值觀的員工

rejoignez une entreprise innovante qui recherche des employés partageant des valeurs claires et transparentes. participez à une équipe engagée où intégrité, authenticité et esprit d'innovation sont au cœur de chaque projet !

Microsoft Edge : 由 Copilot 模式所改變的瀏覽器,人工智能為您的瀏覽提供服務!

découvrez comment le mode copilot de microsoft edge révolutionne votre expérience de navigation grâce à l’intelligence artificielle : conseils personnalisés, assistance instantanée et navigation optimisée au quotidien !

欧盟:针对美国大型科技巨头的审慎监管

découvrez comment l'union européenne impose une régulation stricte et réfléchie aux grandes entreprises technologiques américaines, afin de protéger les consommateurs et d’assurer une concurrence équitable sur le marché numérique.