OpenAI 革新了數位領域,推出了其大膽的 AI 代理 *Operator*,能夠駕馭網絡。這個代理執行複雜任務的能力開創了一個新時代,改變了用戶的生產力和效率。
*一個自主的虛擬助手* 與圖形界面互動,代表了數位消費的一次根本變革。有了 *Operator*,簡化在線行動的執行變成了對個人和企業的一大優勢。OpenAI 確立了一個前所未有的標準,重新定義了任務的自動化,並承諾在數位日常生活中帶來真正的變革。
OpenAI 揭曉 Operator
2025年1月23日,OpenAI 揭開了 Operator 的面紗,這是一個專門設計用來與網絡互動的創新人工智能代理。這一發展緊接著星際專案 的公告,為數位互動推動了一個新範式。OpenAI 的首席執行官 Sam Altman 強調,這一系統成為了徹底改革生產力和創造力的主要趨勢。
Operator 的功能
Operator 取代了用戶通常耗時的工作。它可以填寫表單、在網上訂購商品或創建多媒體內容。簡單地說,使用者用自然語言表達需求,代理便接管其自己的瀏覽器來滿足該需求。
底層技術
這個代理的基礎是一個名為 “Computer-Using Agent” (CUA) 的創新模型。這個 AI 將 GPT-4o 的先進感知能力與通過 強化學習 獲得的複雜推理結合起來。這個模型通過截圖視覺化其瀏覽器的屏幕,並與按鈕和文本框等圖形元素互動。
如果遇到困難或錯誤,Operator 展現出複雜的自我修正能力。代理在必要時不會猶豫地重新調整其行為,以確保用戶體驗流暢和直觀。OpenAI聲稱 CUA 模型已經超越了 WebArena 和 WebVoyager 等基準所建立的標準。
Operator 的實踐應用
這一推出主要側重於重複性使用。Operator 可以執行各種操作,從通過DoorDash 訂餐到在Instacart 上訂購雜貨。每一次與網絡行為者的合作旨在優化用戶在其平台上的體驗。
還與加利福尼亞州斯托克頓市簽訂合作協議,旨在幫助市民更輕鬆地獲取公共服務。這一舉措顯示了 Operator 在多樣場景下的適應能力,包括公共行政。
安全性和隱私
為了監管這一代理,OpenAI 設立了三個保護層級。第一層要求用戶在關鍵時刻例如輸入敏感信息時必須同意。第二層則保證數據的保護,讓用戶能夠一鍵刪除其歷史記錄。安全性至關重要,擁有主動監控模型,能夠檢測並阻止網絡上的可疑行為。
Operator 需要一個每月200美元的 Pro 訂閱,主要面向美國的用戶。計劃逐步向其他訂閱層級擴張,以便更廣泛地應用這一創新技術。OpenAI 也會通過 API 提供 CUA 模型,讓開發者能夠創建自己交互式的代理。
用戶常見問題
什麼是 OpenAI 的 Operator?
Operator 是由 OpenAI 設計的人工智能代理,可以自動化網絡任務,如填寫表單、訂購雜貨或預訂餐廳。
Operator 代理如何運作?
Operator 使用一個名為 “Computer-Using Agent” (CUA) 的模型,結合了電腦視覺和高級推理。它能夠看到並與圖形界面元素互動,就像真正的用戶一樣,使用虛擬的鍵盤和鼠標。
Operator 的主要功能何在?
Operator 的功能包括填寫表單、在線下單和創建圖片,所有這些都可以通過控制自己的瀏覽器來執行所要求的任務。
Operator 是否對所有 OpenAI 用戶開放?
不,Operator 目前僅限於美國的 ChatGPT Pro 訂閱者,但 OpenAI 計劃在不久的將來擴大其對其他訂閱層級的訪問。
Operator 設置了哪些保護層級?
OpenAI 設立了三個保護層級:代理在輸入關鍵信息時讓出控制,允許用戶刪除其瀏覽歷史,並針對惡意網站進行防護。
Operator 如何處理錯誤或複雜情況?
如果遇到問題或障礙,Operator 利用其推理能力進行自我修正,並在必要時讓用戶主導,無需堅持執行某個操作。
OpenAI 參與 Operator 專案的合作夥伴有哪些?
OpenAI 與多家大型企業合作,如 DoorDash、Instacart、OpenTable、Priceline、StubHub 和 Uber,旨在優化用戶在不同平台上的體驗。
Operator 的未來展望如何?
OpenAI 計劃通過其 API 擴展 Operator 的功能,允許開發者創建與圖形界面互動的代理,從而擴大應用的可能性。