據(jù)媒體報(bào)道,OpenAI正準(zhǔn)備推出一款代號(hào)為“Operator”的全新AI助理產(chǎn)品,可以自動(dòng)執(zhí)行各種復(fù)雜操作,包括編寫(xiě)代碼、預(yù)訂旅行、自動(dòng)電商購(gòu)物等。根據(jù)內(nèi)部員工爆料,OpenAI領(lǐng)導(dǎo)層預(yù)計(jì)將在2025年1月發(fā)布該產(chǎn)品,首先作為研究預(yù)覽版和開(kāi)發(fā)工具推出,屆時(shí)將為開(kāi)發(fā)人員開(kāi)放API接口。
報(bào)道稱,OpenAI一直在進(jìn)行幾個(gè)與智能體相關(guān)的研究項(xiàng)目。其中一位人士表示,最接近完成的將是一個(gè)在網(wǎng)絡(luò)瀏覽器中執(zhí)行任務(wù)的通用工具。
AI助理(AI Agent)是一種能夠感知環(huán)境、進(jìn)行決策和執(zhí)行動(dòng)作的智能實(shí)體,具備通過(guò)獨(dú)立思考、調(diào)用工具去逐步完成給定目標(biāo)的能力,既能為C端提供個(gè)性化應(yīng)用,也能為B端提供降本增效方案。對(duì)于普通用戶而言,AI助理最核心的功能是AI自主操作手機(jī),輔助完成復(fù)雜推理任務(wù)。
OpenAI首席執(zhí)行官阿爾特曼早已透露下場(chǎng)意愿。幾周前,他在Reddit的“問(wèn)我任何問(wèn)題”(Ask Me Anything)論壇上表示,“我們將擁有越來(lái)越好的模型,但我認(rèn)為下一個(gè)重大突破將是AI助手!痹谏蟼(gè)月公司年度開(kāi)發(fā)日之前的OpenAI新聞發(fā)布會(huì)上,該公司首席產(chǎn)品官Kevin Weil稱:“我認(rèn)為2025年將是Agent系統(tǒng)最終進(jìn)入主流的一年。”
站在OpenAI的角度,其在商業(yè)化進(jìn)程中面臨著越來(lái)越大的壓力, ChatGPT漸進(jìn)式的改進(jìn)可能無(wú)法吸引用戶支付更高的價(jià)格。高管急切需要一款突破性產(chǎn)品,以證明對(duì)AI開(kāi)發(fā)的巨額投資是值得的。
目前,OpenAI已開(kāi)源了多功能協(xié)同AI Agent——Swarm,可創(chuàng)建多個(gè)智能體協(xié)同工作,以更高效地完成任務(wù)。其GPT o1模型增強(qiáng)了推理能力,使其在復(fù)雜問(wèn)題的解決和用戶交互的自然性方面均有顯著進(jìn)步,亦使其更加適用于AI Agent場(chǎng)景。
AI助理被視作通往AGI的核心基礎(chǔ),在硬件廠商言必稱AI的時(shí)代,AI助理或成為終端智能化的突破口。甬興證券表示,AI Agent或?qū)⒄莆找苿?dòng)互聯(lián)新入口,流量分發(fā)格局有望重塑AI Agent智能體因具備較強(qiáng)交互性以及便利性,或可打通原先同個(gè)終端不同App之間的天然壁壘。
據(jù)《科創(chuàng)板日?qǐng)?bào)》不完全梳理,國(guó)內(nèi)外頭部廠商正爭(zhēng)先推出AI助理產(chǎn)品——
微軟近期低調(diào)開(kāi)源了AI工具OmniParser,其可幫助用戶創(chuàng)建個(gè)性化智能體,以操作個(gè)人計(jì)算機(jī);10月22日,微軟宣布在Dynamics 365中集成10個(gè)自主AI Agent,支持OpenAI最新模型o1,具備自主學(xué)習(xí)能力,可自動(dòng)執(zhí)行跨平臺(tái)復(fù)雜業(yè)務(wù);9月,微軟推出了一款名為Windows Agent Arena的基準(zhǔn)框架,同樣屬于AI助理開(kāi)發(fā)范疇。
據(jù)The Information報(bào)道,谷歌計(jì)劃在12月預(yù)覽其大型動(dòng)作模型“Project Jarvis”,該項(xiàng)目將幫助用戶執(zhí)行諸如“收集研究、購(gòu)買(mǎi)產(chǎn)品或預(yù)訂航班”等任務(wù)。
10月22日,Anthropic為大模型Claude迭代了新功能——Computer Use,讓AI可以像人一樣操控電腦。Claude3.5 Sonnet是首個(gè)支持計(jì)算機(jī)控制的模型,能夠模擬人類操作計(jì)算機(jī),包括移動(dòng)光標(biāo)、點(diǎn)擊按鈕和輸入文本。
蘋(píng)果選擇將Siri與ChatGPT集成,實(shí)現(xiàn)更智能的人機(jī)交互,另有網(wǎng)友發(fā)現(xiàn)蘋(píng)果已經(jīng)默默發(fā)布了Ferret-UI的兩個(gè)實(shí)現(xiàn)版本(分別基于Gemma 2B和Llama 8B),這是蘋(píng)果今年5月發(fā)布的一個(gè)可讓AI理解手機(jī)屏幕的技術(shù)。
華為則公布了一項(xiàng)可讓AI像人類一樣操作手機(jī)的新研究成果,相關(guān)團(tuán)隊(duì)提出了一個(gè)手機(jī)控制架構(gòu):Lightweight Multi-modal App Control(輕量級(jí)多模態(tài)應(yīng)用控制,簡(jiǎn)稱LiMAC)。
中國(guó)獨(dú)角獸企業(yè)智譜AI已上線AI助理工具AutoGLM,無(wú)需手動(dòng)操作,用戶對(duì)著手機(jī)說(shuō)話(發(fā)出指令),便可讓其自動(dòng)打開(kāi)手機(jī)上的各類App,進(jìn)行網(wǎng)購(gòu)、點(diǎn)外賣(mài)、訂高鐵票,甚至發(fā)微信、搶紅包、評(píng)論朋友圈、整理筆記并生成攻略、總結(jié)論文。
中信證券表示,AutoGLM等終端AI助理技術(shù)將帶來(lái)更短路徑的交互形式,接受語(yǔ)音指令并自動(dòng)完成復(fù)雜操作的能力將為消費(fèi)者帶來(lái)極大便利,其有望成為AI終端的亮點(diǎn)功能并吸引消費(fèi)者升級(jí)換代。
華泰證券也表示,AI助理落地將帶來(lái)多個(gè)層次的產(chǎn)業(yè)機(jī)遇,其中,Agent+終端有望推動(dòng)人機(jī)交互變革,除了在終端銷售量?jī)r(jià)方面的變化外,可能對(duì)終端應(yīng)用的商業(yè)模式產(chǎn)生更加深遠(yuǎn)的影響。