Deep Cogito v2 : 一個開源的人工智能,不斷完善其推理能力

Publié le 2 8 月 2025 à 09h17
modifié le 2 8 月 2025 à 09h17

人工智能正在经历一场革命,随着Deep Cogito v2的到来,它重新定义了推理和学习的概念。这个开源模型蕴含着创新,展示了一种大胆追求前所未有的认知自主权的努力。通过一种独特的方法,它将学习集中在自己的推理过程上,使得这款人工智能超越了传统的限制。

*Cogito v2的复杂架构* 赋予了它令人印象深刻的能力,从数据处理到图像理解。*6710亿参数的模型* 被称为全球最强大的模型之一。*每一次进步都证明了一场革命*,可能会改变我们与技术和人工智能的互动方式。

Deep Cogito v2:开源人工智能的重要进展

Deep Cogito 最近推出了其新的开源人工智能模型系列,名为Cogito v2。该系列以其提高自身推理能力的能力而著称,标志着人工智能技术演进的重要一步。这些模型在开源许可下发布,包括四个混合推理变体,分为两个中型和两个大型模型。

Cogito v2模型的特点

Cogito v2系列包括具有700亿和1090亿参数的模型,以及更大规模的4050亿和6710亿参数的版本。最大的模型,671B专家混合模型(MoE),已被认为是全球开源人工智能中最强大的之一。

Deep Cogito 的负责人报告称,该模型的性能与最新的DeepSeek创新相当。该模型还能够与O3和Claude 4 Opus等专有系统竞争,从而表明开源解决方案与商业解决方案之间的显著接近

推理的新方法

Cogito v2与之前的模型不一样的不仅是规模或力量,而是一种根本性的变化,改变了人工智能获取知识的方式。系统的设计使得推理过程得以内化。与其仅仅延长推理时的思考时间以寻找答案,这种新架构学会了将其发现转化为其内部参数的组成部分。

这种推理的内化采用了一种称为迭代蒸馏与放大(IDA)的方法。该技术提炼从研究中得出的结论,并将其重新整合到模型的基础参数中。其目的是构建一种增强的直觉,使人工智能能够在不进行全面搜索的情况下预见自身推理的结果。

性能与效率

Cogito v2模型的推理链平均比竞争对手Deepseek R1的链短60%。这种效率同时也体现在预算上,Deep Cogito声称其模型的总开发成本低于350万美元。尽管这个数字对于公众来说可能显得相当可观,但与许多顶级AI实验室的预算相比,这仍然微不足道。

思考过程的优化

670亿参数的大型模型得到了特别关注,不仅被训练以完善最终答案,还为了优化其思维过程。这一策略抑制了推理过程中的偏差,促进了更直接地达到解决方案的方法。性能数据表明,这种方法是有效的,Deep Cogito的开源模型在关键基准测试中与DeepSeek的最新版本持平或超越。

模型的涌现能力

其中一个最意想不到的结果在于这些模型能够对图像进行推理,这一技能并没有被明确学习。团队分享了一个例子,其中Deep Cogito的模型比较了两幅图像,一只鸭子和一只狮子。这一比较展示了关于它们栖息地、颜色和构成的深刻思考过程,仅仅通过迁移学习。这种涌现特性可能成为未来多模态推理系统生成学习数据的强大手段。

Deep Cogito的未来与承诺

Deep Cogito团队的成员计划在追求实现超级智能的过程中“攀登迭代改进的高峰”。他们重申承诺,确保所有开发的人工智能模型将是开源的。这个决定符合在业界日益增长的技术进步共享趋势。

为了深入探讨与人工智能和大数据相关的主题,将会有诸如AI & Big Data Expo等重大活动在阿姆斯特丹、加利福尼亚和伦敦举行。

关于Deep Cogito v2的常见问题解答

什么是Deep Cogito v2,它与其他人工智能模型有什么不同?
Deep Cogito v2是一系列新的开源AI模型,专注于通过一种称为迭代蒸馏与放大(IDA)的过程来完善其推理能力。这使得它能够整合自己的推理过程,赋予其更好的直觉与更高的效率。

Cogito v2家族中包含哪些类型的模型?
Cogito v2系列包括四个混合推理模型:两个中型模型,分别为70B和109B参数,以及两个大规模模型,分别为405B和671B参数。671B模型因其强大而备受赞誉。

迭代蒸馏与放大(IDA)技术如何改善人工智能的推理?
IDA技术使模型能够将研究过程中获得的教训整合到其基础参数中,从而使其能够在不必每次都进行繁琐搜索的情况下预测推理结果。

Cogito v2对开发成本的影响如何与其他AI实验室相比?
Deep Cogito以不到350万美元的总成本开发了所有模型,这在大型AI实验室的通常开支中相对较低,从而降低了该领域创新的进入门槛。

671B模型有什么独特之处及其应用是什么?
671B模型特别设计用于不仅提高其最终回答的质量,而且优化推理过程本身,使其能够在各种应用领域提供更直接和更有效的解决方案。

Deep Cogito模型能够进行什么类型的推理,特别是关于图像方面的?
令人惊讶的是,Deep Cogito模型能够进行关于图像的推理,尽管它们并未明确接受过这样的训练。它们能够比较和分析视觉元素,例如栖息地和颜色,依赖于迁移学习过程。

Deep Cogito团队对人工智能的未来抱有什么样的雄心?
Deep Cogito团队计划利用自我迭代改进所获得的成果,不断推进开发超级智能,同时坚持他们确保所有创建的人工智能模型是开源的承诺。

actu.iaNon classéDeep Cogito v2 : 一個開源的人工智能,不斷完善其推理能力

谷歌承诺在印度投资100亿美元用于人工智能数据中心项目

google prévoit d'investir 10 milliards de dollars dans la construction de data centers spécialisés en intelligence artificielle en inde, renforçant ainsi l'infrastructure numérique et soutenant l'innovation technologique du pays.

特朗普的假支持者:在社交媒体上推动的虚假抗议者

découvrez comment des faux soutiens pro-trump, créés de toutes pièces, envahissent les réseaux sociaux. analyse de la propagation de manifestants fictifs et de leur influence sur l’opinion publique.

著作權法中的TDM例外:歐洲人工智能發展的關鍵優勢

découvrez comment l'exception de text and data mining (tdm) en droit d'auteur favorise le développement de l'intelligence artificielle en europe, en offrant un cadre juridique adapté à l'innovation et à la recherche.

分析揭示:86% 的人工智能引用来自品牌控制的来源

découvrez comment 86 % des références aux intelligences artificielles sont générées par des sources contrôlées par les marques. une étude inédite dévoile l'ampleur de l'influence des entreprises sur la perception de l'ia.

「ChatGPT,我的無價盟友」:在拼寫上遇到困難的年輕專業人士的巧妙小技巧

découvrez comment de jeunes professionnels surmontent leurs difficultés en orthographe grâce à chatgpt et partagent leurs astuces ingénieuses pour améliorer leur écriture au quotidien.

演员们坚决反对在人工智能生成的内容中使用他们的形象:这是对公平的威胁

découvrez pourquoi de nombreux acteurs s'élèvent contre l'utilisation de leur image par l'intelligence artificielle, invoquant une atteinte à l'équité et à leurs droits. analyse et enjeux de ce débat dans l'industrie du cinéma.