Une méthode innovante pour renforcer la confiance dans l'IA

各行各業中人工智能模型的迅猛發展需要對其可靠性提供堅實的保障。一個主要挑戰在於準確評估預測的不確定性。當前模型難以界定其知識邊界，讓使用者對其穩健性充滿不確定性。一種新的不確定性分析方法旨在提高對這些模型訓練的信心。這種方法的整合正在徹底改變AI的格局，使預測更加可靠，發現更加即時。

量化AI模型不確定性的新方法

來自能源部太平洋西北國家實驗室的研究人員開發了一種方法，用以評估與人工智能模型相關的不確定性，尤其是那些被稱為神經網絡潛能的模型。這項進展集中在評估這些模型所提供的回答，從而檢測何時預測超過其訓練的邊界。

評估的背景與必要性

科學家希望利用人工智能提供的迅速預測。應用這些技術可在材料和藥物領域提供競爭優勢。然而，這些預測的速度與其準確性之間存在著掙扎。對於確保對AI結果的適當信任的系統的需求變得迫在眉睫。數以百萬計的投資在該領域的證據隨處可見。

新方法的運作方式

PNNL團隊開發的方法量化了AI模型的不確定性，並識別出需要進一步訓練的區域。研究人員發現某些不確定性模型表現出過度自信，即使在預測錯誤顯著的情況下也尤為明顯。這種過度自信在深度神經網絡中普遍存在，但SNAP的方法能夠減輕這一現象。

合作與工具的提供

研究的作者，Jenna Bilbrey Pope 和 Sutanay Choudhury，通過GitHub実施了其方法的公開發布過程。這使得世界各地的研究人員能夠在其工作中整合這些工具，進一步促進合作與創新。這種知識的分享對推進科學社區至關重要。

對化學和材料研究的影響

研究結果顯示，該方法可用於評估預測模型（如MACE）如何形成，以估計不同材料系列的能量。這類計算對於理解通常分配給超級計算機的更耗時和耗能的方法具有顯著影響。這些研究人員的工作為提高使用AI進行模擬的信心鋪平了道路。

對自主實驗室的優勢

這項進展也旨在促進將AI工作流程納入實驗室的日常工作，將人工智能轉變為可靠的實驗室助手。模型清楚指示其知識邊界的能力將使科學家能夠以可測量的信心水平來對待預測。這一方法的抱負是推動AI的使用進入新的領域。

研究人員的聲明

團隊成員強調可靠評估預測的重要性。“AI必須能夠檢測其邊界，”Choudhury解釋道。這將促使更謹慎的聲明，例如：“根據您的標準，這一預測提供了85%的信心，表明催化劑A優於催化劑B。”

媒體和行業的反響

這項研究的影響超越了科學界。大型科技公司對AI的投資超過3200億美元，反映出對效率的挑戰也體現在模型的可靠性上。對AI信任的問題如今成為討論的核心。

欲了解更多資訊，可查閱以前關於該主題的文章。例如，作家對計算機玩笑的反應成為當今AI領域的熱議話題：這裡鏈接。有關科技公司支出義務的深入反思，亦可參考這篇文章。

有關人工智能模型不確定性評估的常見問題

人工智能模型不確定性評估的重要性為何？
評估不確定性能夠測量人工智能模型所提供預測的可靠性，這對於在科學及工業背景下做出明智決策至關重要。

PNNL開發的方法如何改善人工智能模型的訓練？
該方法量化了模型預測中的不確定性，幫助研究人員識別其模型的邊界並確定需要進一步訓練的領域。

在此上下文中“主動學習”這一術語是什麼？
主動學習指的是一個過程，其中模型通過識別困難或不確定的示例進行學習，從而隨著時間提高其性能和準確性。

模型過度自信有何問題？
過度自信可能導致對結果的錯誤解釋，增加基於預測的決策錯誤風險，尤其是當模型訓練不足時。

人工智能模型是否真的能在實驗前預測材料的性質？
是的，通過良好訓練的AI模型，可以相對準確地預測材料的性質，從而減少與實驗測試相關的時間和成本。

PNNL研究人員用什麼方法驗證他們的不確定性評估方法？
他們使用了先進的原子材料化學模型（如MACE）進行基準測試，以評估預測的準確性和可靠性。

SNAP模型在不確定性評估中扮演什麼角色？
SNAP模型提供了一個框架，能夠在考慮不確定性的情況下整合神經網絡潛能，從而提高AI模型提供結果的可靠性。

當前方法如何改變科學家對AI的看法？
這使得科學家能夠將AI視為可信的工具，能夠協助進行研究和開發，而非難以解釋決策的“黑箱”。

一种评估不确定性的全新方法是朝着建立对人工智能模型训练的信心迈出的重大一步。

量化AI模型不確定性的新方法

評估的背景與必要性

新方法的運作方式

合作與工具的提供

對化學和材料研究的影響

對自主實驗室的優勢

研究人員的聲明

媒體和行業的反響

有關人工智能模型不確定性評估的常見問題

苹果公司（AAPL）的股票因Siri的重塑而飙升，旨在与OpenAI和Perplexity竞争

Nick Frosst de Cohere 證實 Cohere Command 在效率上超越 DeepSeek 八到十六倍

« 他禁止我们使用 ChatGPT，但他自己却沉迷于此… » : 学生们对教师使用人工智能准备课程的反抗

家长在孩子使用 ChatGPT 时出现急性困扰的警报

一台机器人在只经过一次教导后就能像人类一样掌握大型物体的操作

一种新的生成性人工智能方法用于预测化学反应

一种评估不确定性的全新方法是朝着建立对人工智能模型训练的信心迈出的重大一步。

量化AI模型不確定性的新方法

評估的背景與必要性

新方法的運作方式

合作與工具的提供

對化學和材料研究的影響

對自主實驗室的優勢

研究人員的聲明

媒體和行業的反響

有關人工智能模型不確定性評估的常見問題

.tdi_114{z-index:84546!important}Nick Frosst de Cohere 證實 Cohere Command 在效率上超越 DeepSeek 八到十六倍

.tdi_133{z-index:84546!important}« 他禁止我们使用 ChatGPT，但他自己却沉迷于此… » : 学生们对教师使用人工智能准备课程的反抗

.tdi_152{z-index:84546!important}家长在孩子使用 ChatGPT 时出现急性困扰的警报

.tdi_171{z-index:84546!important}一台机器人在只经过一次教导后就能像人类一样掌握大型物体的操作

.tdi_190{z-index:84546!important}一种新的生成性人工智能方法用于预测化学反应

Nick Frosst de Cohere 證實 Cohere Command 在效率上超越 DeepSeek 八到十六倍

« 他禁止我们使用 ChatGPT，但他自己却沉迷于此… » : 学生们对教师使用人工智能准备课程的反抗

家长在孩子使用 ChatGPT 时出现急性困扰的警报

一台机器人在只经过一次教导后就能像人类一样掌握大型物体的操作

一种新的生成性人工智能方法用于预测化学反应