123,123

飛象原創(chuàng)（高靖宇/文）站在2024年的技術(shù)十字路口，AI正在全面改造手機(jī)行業(yè)，無論是在功能創(chuàng)新還是用戶體驗上，AI驅(qū)動的手機(jī)都讓人眼前一亮。從硬件升級到智能化的深度融合，手機(jī)廠商都在加速擁抱AI。

對于手機(jī)廠商來說，AI不僅僅是“能做什么”，而是“能為你做什么”，如何讓AI“更懂你”，利用AI實現(xiàn)更高效的用戶體驗，這正是驅(qū)動AI手機(jī)未來發(fā)展的核心意義所在。

10月10日，2024 vivo開發(fā)者大會上，vivo正式發(fā)布“藍(lán)心智能”AI戰(zhàn)略，其中PhoneGPT（即“手機(jī)智能體”），是vivo基于藍(lán)心大模型技術(shù)做出的一次全新探索。而從“智能”到“智能體”這一字之差的變化，標(biāo)志著AI手機(jī)進(jìn)入到一個全新的個人智能體時代。

PhoneGPT：AI手機(jī)的全新蛻變

回想AI與手機(jī)的初遇，還是在Siri、Google Assistant等語音助手的出現(xiàn)，讓人們第一次感受到了“智能”的觸手可及。用戶可以通過簡單的語音命令讓手機(jī)完成任務(wù)，例如查詢天氣、設(shè)定提醒或是發(fā)短信。然而，這類助手的局限性很快顯現(xiàn)：它們大多只能基于關(guān)鍵詞作出反應(yīng)，無法真正理解用戶的意圖。你問，它答，流程機(jī)械而僵化，遠(yuǎn)不能稱之為“智能”。

大模型的應(yīng)用使得手機(jī)AI能力有了革命性的提升，“AI手機(jī)”已經(jīng)是完全不同的概念，AI技術(shù)在語音識別、圖像識別、智能推薦等方面更是取得了長足進(jìn)步，給用戶帶來了全新的使用體驗。

不過，AI手機(jī)依然沒有擺脫“你問我答”的模式，也就是用戶必須清晰地表達(dá)命令，手機(jī)才能作出反應(yīng)，遠(yuǎn)未達(dá)到“懂你”的地步。而vivo發(fā)布的PhoneGPT，具備自主拆解需求、主動規(guī)劃路徑、實時環(huán)境識別、動態(tài)反饋決策等能力�？梢院唵蔚睦斫鉃�，手機(jī)AI能力不再停留在單一功能層面，而是以“智能體”的形式具備了完整“思考”用戶需求的能力。

據(jù)vivo副總裁周圍介紹，PhoneGPT已可以準(zhǔn)確識別手機(jī)屏幕界面中的內(nèi)容，并自主操作手機(jī)的電話、短信等各類應(yīng)用程序，完成用戶交代的任務(wù)。

在演示中，藍(lán)心小V不僅可以對屏幕界面進(jìn)行識別和操作，也可以通過接管音頻進(jìn)行自主對話，以完成用戶交代的任務(wù)，例如幫助我們?nèi)ビ啿蛷d、訂咖啡等等。

“這是手機(jī)自動化的一小步，卻是解放用戶雙手的一大步�！敝車Q，未來PhoneGPT會帶來更多的應(yīng)用場景，更好的智能體驗，讓小V成為更懂你的私人助理。

藍(lán)心智能：用AI重構(gòu)系統(tǒng)體驗

PhoneGPT背后，是來自于vivo全新的AI戰(zhàn)略——藍(lán)心智能。藍(lán)心智能是將大模型技術(shù)與手機(jī)操作系統(tǒng)深度融合的個人智能。周圍解釋，以藍(lán)心大模型為技術(shù)底座，藍(lán)心智能可以理解用戶的個人情景和偏好，為用戶提供個人化的專屬服務(wù); 同時，藍(lán)心智能將全方位守護(hù)用戶的隱私安全; 通過系統(tǒng)深度融合，為用戶持續(xù)構(gòu)建更自然、符合直覺的交互，帶來更智能溫暖的體驗。

為了達(dá)成這一點，vivo從三個方面用AI重構(gòu)了系統(tǒng)體驗。首先是重構(gòu)人與設(shè)備的交互體驗，讓交互更自然更符合直覺。在藍(lán)心大模型的加持下，手機(jī)將具備更強(qiáng)大的分析能力，多模態(tài)大模型都可以深度解讀你的意圖，進(jìn)而給你需要的反饋和服務(wù)。而依托文本大模型，讓藍(lán)心小V在文本能力外，進(jìn)一步具備強(qiáng)大的語音表征理解與生成能力，進(jìn)而讓手機(jī)能夠與人自然對話、翻譯語言、模擬人聲甚至理解對話中的情緒。

第二個方面是重構(gòu)人與數(shù)字世界的服務(wù)體驗，讓智能更加個人化，也就是構(gòu)建簡單高效的服務(wù)獲取能力和主動服務(wù)能力，讓人找服務(wù)的同時，服務(wù)也主動匹配人的需求。

第三個方面是重構(gòu)人與物理世界的連接體驗，讓溝通更順暢和溫暖。去年，vivo讀譜功能的發(fā)布，讓喜愛音樂的視障人士可以利用手機(jī)學(xué)習(xí)樂譜和樂器。而今，vivo利用多模態(tài)大模型，讓手機(jī)成為視障人士的眼睛，幫助他們跨越溝通的鴻溝。

藍(lán)心大模型矩陣：全面升級大模型能力

為進(jìn)一步夯實AI能力底座，vivo在今年的開發(fā)者大會上發(fā)布了全新自研藍(lán)心大模型矩陣。全面升級語言大模型和端側(cè)大模型能力，并帶來vivo自研的語音大模型、圖像大模型以及多模態(tài)大模型。這預(yù)示藍(lán)心智能，向著個人化和多元化發(fā)展邁出重要的一步。

在語言大模型上，千億級藍(lán)心云端大模型，重點優(yōu)化了意圖理解與分發(fā)和任務(wù)規(guī)劃能力。相比去年，整體能力提升30%，在SuperCLUE和C-EVAL榜單上繼續(xù)領(lǐng)跑國內(nèi)第一梯隊。

用戶的隱私安全始終是vivo打造藍(lán)心智能的首要原則，繼去年帶來了三款端側(cè)大模型之后，vivo正式發(fā)布全新30億參數(shù)量級的藍(lán)心端側(cè)大模型3B。在對話寫作、摘要總結(jié)、信息抽取等能力上，藍(lán)心3B可以越級比肩行業(yè)7B-9B模型。相比藍(lán)心7B，藍(lán)心 3B極致性能提升300%，平衡模式下功耗優(yōu)化達(dá)46%，極致出詞速度可以達(dá)到80字/s，系統(tǒng)功耗僅450mA，內(nèi)存占用僅1.4GB。在SuperCLUE和Equal Eval的小模型綜合能力評測中，藍(lán)心3B均排名第一，同時獲得了泰爾實驗室端側(cè)大模型綜合能力認(rèn)證以及AIIA安全防范能力認(rèn)證。

除此之外，vivo還同步帶來了可以準(zhǔn)確理解自然語義，模擬人聲的全新自研藍(lán)心語音大模型、強(qiáng)化中國特色與東方美學(xué)的融合生成能力的藍(lán)心圖像大模型以及升級視覺感知理解能力的藍(lán)心多模態(tài)大模型。

周圍表示，藍(lán)心智能將以藍(lán)心大模型矩陣為技術(shù)底座，繼續(xù)探索AI與OS的深度融合，持續(xù)打造開放共贏的智能體生態(tài)。

未來已來，AI手機(jī)正在改變我們與世界的連接方式，你準(zhǔn)備好迎接PhoneGPT時代了嗎？

AI手機(jī)的下一站：PhoneGPT