2025-12-20 13:40:33
繼聯(lián)合中興努比亞發(fā)布“豆包手機”nubia M153后,12月19日,字節(jié)跳動推進與多家硬件廠商的AI手機合作。在以“豆包手機”為代表的GUI陣營試圖接管屏幕的時候,反觀海外,蘋果、谷歌主導的陣營堅持API標準化路線,雖穩(wěn)健卻進展遲緩。兩種技術路線的博弈,是移動互聯(lián)網(wǎng)十余年商業(yè)邏輯與利益格局的劇烈碰撞,也將深度改寫手機廠商、應用開發(fā)者與用戶的關系。
每經(jīng)記者|高涵 每經(jīng)編輯|王嘉琦
AI手機的技術路線已形成鮮明分野。
12月19日,字節(jié)跳動在聯(lián)合中興努比亞推出“豆包手機”nubia M153后再傳擴圍動作——正與vivo、聯(lián)想、傳音等廠商推進AI手機合作。
以“豆包手機”為代表的陣營,憑借讀屏、模擬點擊等GUI(圖形用戶界面)技術,試圖讓AI助手突破應用壁壘完成復雜任務,卻引發(fā)主流App集體“自衛(wèi)”。
反觀海外,蘋果、谷歌主導的陣營,則堅持API(應用程序接口)標準化路線,雖穩(wěn)健卻進展遲緩。

兩種技術路線的博弈,是移動互聯(lián)網(wǎng)十余年商業(yè)邏輯與利益格局的劇烈碰撞。流量入口遷移的序幕已然拉開,手機廠商、應用開發(fā)者與用戶的關系正被深度改寫。
這場路線之爭的導火索,是12月初字節(jié)跳動聯(lián)合中興努比亞發(fā)布的“豆包手機”nubia M153。這款手機憑借跨應用AI操作能力攪動行業(yè):用戶只需發(fā)出語音指令,AI便能完成訂外賣、發(fā)微信、比價購物等一系列跨App任務,其技術核心是GUI(圖形用戶界面)多模態(tài)大模型與系統(tǒng)級權限的深度綁定。

豆包手機 圖片來源:中興商城
前小米OS AI產(chǎn)品專家、現(xiàn)出海AI應用公司ExcelMaster.ai創(chuàng)始人張和告訴《每日經(jīng)濟新聞》記者(以下稱每經(jīng)記者),通過與手機廠商(如中興)達成操作系統(tǒng)層面的深度合作,讓AI助手獲得凌駕于所有App之上的系統(tǒng)級操作權限。其技術邏輯是模擬人類的點擊、滑動等操作,貫通全手機應用,實現(xiàn)跨App的任務執(zhí)行。
但AI助手直接“接管”屏幕,很快引發(fā)主流App的“自衛(wèi)反擊”:微信提示環(huán)境異常甚至封號,淘寶頻繁彈出人機驗證,各大銀行App則直接拒絕在錄屏狀態(tài)下運行。
12月9日,智譜AI宣布開源自主任務模型AutoGLM,為GUI路線提供了另一種可能性。
AutoGLM同樣基于GUI范式,通過視覺大模型實現(xiàn)手機自動化操作,但此前因未獲廠商系統(tǒng)級權限支持,只能依賴安卓無障礙模式運行。
張和指出,無障礙模式存在明顯短板:“AI操作時會完全占據(jù)前臺窗口,比如操作淘寶一分鐘內(nèi),用戶無法刷微博、聊天?!钡麖娬{,豆包與智譜AutoGLM本質同源,都是大模型廠商視角的探索,僅開源與否的差異。“只要手機廠商配合,智譜AutoGLM也能實現(xiàn)后臺靜默操作,核心癥結始終是系統(tǒng)權限?!?/p>
獲得中興努比亞手機的系統(tǒng)級權限,是豆包率先做出AI手機的核心原因之一。
但張和指出,這類合作的主動權掌握在手機廠商手里——并非廠商不具備同等技術研發(fā)能力,而是“要不要做(AI手機)”的戰(zhàn)略考量。
廠商的顧慮主要有兩點:首先是用戶對隱私泄露的普遍擔憂,貿(mào)然開放權限可能嚴重影響手機品牌的用戶口碑和形象;其次,手機廠商希望將系統(tǒng)級AI入口牢牢掌握在自己手中,而非淪為AI公司的技術通道。
“這也解釋了為何豆包的首個合作伙伴是中興努比亞,而非頭部廠商?!睆埡脱a充道。
豆包手機的出現(xiàn),也引發(fā)了全球范圍內(nèi)關于AI手機兩條技術路線——GUI范式與API(應用程序接口)范式——的對比和討論。
豆包和智譜的GUI,如同一個“AI保姆”,它像人一樣看著手機屏幕,幫用戶操作手機。蘋果和谷歌的API路線,則像給App們發(fā)了一套“手冊”,讓它們自己把功能開放出來給系統(tǒng)調用。
兩者的優(yōu)劣對比十分鮮明:GUI不依賴App開發(fā)者配合,通過視覺大模型“讀取”屏幕、模擬人類點擊實現(xiàn)操作,優(yōu)點是通用性強,理論上人能使用的App它都能駕馭;但缺點同樣突出,一是隱私保護壓力大,二是效率較低,需逐步驟操作且易出錯。
以蘋果Apple Intelligence為代表的API范式,不是通過模擬,而是構建底層框架與標準化接口,讓AI通過規(guī)范“調用能力”完成任務。這種模式的優(yōu)點是穩(wěn)定、保障隱私且效率高,缺點則是需要App開發(fā)者主動配合,生態(tài)構建周期更長。


iPhone 17搭載Apple Intelligence 圖片來源:蘋果官網(wǎng)
張和評價蘋果是“最保守的大玩家”。
2022年,蘋果推出Apps Intent框架,鼓勵開發(fā)者向系統(tǒng)聲明功能供Siri調用,但堅決不開放讀屏繞開應用的能力;即便未落地的“屏幕感知”功能,也選擇通過API向Siri提供屏幕內(nèi)容,而非直接操控界面。
當前,蘋果Apple Intelligence集成了OpenAI的ChatGPT。而據(jù)媒體報道,蘋果正計劃采用谷歌的Gemini模型,為Siri語音助手升級提供技術支撐。蘋果希望將該技術作為臨時解決方案,直到自家模型足夠強大。

Pixel 10搭載Gemini大模型 圖片來源:谷歌官網(wǎng)
谷歌則走端云協(xié)同路線,且優(yōu)先布局電腦端。旗下Gemini大模型具備強大端云協(xié)同能力,但手機端未采用GUI多模態(tài)操作;推出的AppFunctions API,旨在解決生態(tài)內(nèi)的碎片化問題,實現(xiàn)系統(tǒng)對應用能力的統(tǒng)一發(fā)現(xiàn)與索引。
谷歌和蘋果均傾向于推動應用開發(fā)者主動接入標準化接口,實現(xiàn)AI助手跨應用協(xié)作。
張和透露,目前兩家公司尚未在手機上推出GUI多模態(tài)操作相關功能,仍處于技術儲備階段。“谷歌一方面需要協(xié)調安卓生態(tài)的手機廠商,另一方面也在觀望市場反饋和技術成熟度。”
市場調查機構Canalys報告顯示,得益于芯片技術的快速發(fā)展和消費者對AI功能日益增長的需求,全球AI手機出貨占比將從2024年的16%升至2028年的54%。該機構預計,2023年至2028年的年復合增長率將達到63%,三星和蘋果等主要玩家將推動這一增長。
技術路線的抉擇,最終將指向移動互聯(lián)網(wǎng)利益格局的深度重構。
“靠AI助手去購物,相當于直接介入交易,互聯(lián)網(wǎng)大廠自然擔心商業(yè)模式受影響?!睆埡忘c出了超級App集體“自衛(wèi)”的核心焦慮。
API類似手機廠商向各家互聯(lián)網(wǎng)大廠商議,讓后者開發(fā)接入手機智能助手的API接口,在限定范圍內(nèi)向AI開放部分功能。這一模式下,主動權掌握在互聯(lián)網(wǎng)大廠手中,是否開放API接口、對誰開放、開放多少功能,都是未來提供議價權的籌碼。
而GUI Agent可以通過“看屏幕、點按鈕”的方式來操作App,相當于繞過了App對AI許可授權的過程。
更關鍵的是,GUI Agent將用戶操作截留在了手機系統(tǒng)層面:用戶無需打開App,就能使用其核心功能。這意味著,App上的廣告投放將失去核心價值——而廣告收入正是互聯(lián)網(wǎng)行業(yè)的重要營收來源。
張和認為,未來AI手機的生態(tài)將呈現(xiàn)“分層治理”格局,不同體量玩家命運迥異。
對于微信、淘寶等超級App而言,短期可以通過技術手段抵制外部AI讀屏,保護商業(yè)數(shù)據(jù)與用戶隱私。長期最優(yōu)解是自研AI Agent,形成Agent to Agent(A2A)協(xié)作模式:系統(tǒng)級AI將用戶意圖傳遞給應用Agent,后者在權限內(nèi)完成操作。這種模式既保護超級App“領地”,又能融入AI手機生態(tài)。
對于數(shù)以百萬計的中長尾App來說,處境則將完全不同。
張和認為,長尾App因缺乏自研Agent的技術與商業(yè)話語權,大概率將“被系統(tǒng)級AI直接控制”。對它們而言,與其投入資源拉新獲客,不如接受系統(tǒng)級級AI操作,換取新生態(tài)的流量分發(fā)。手機廠商或會制定標準化利益分配條款,讓長尾應用“搭上生態(tài)紅利”。
“這就像自動駕駛,是不可逆轉的歷史趨勢?!睆埡涂偨Y道。以用戶需求為核心的變革,將推動生態(tài)從“流量爭奪”走向“價值共創(chuàng)”,最終形成手機廠商主導,超級App、長尾應用和大模型廠商各司其職的全新格局。
封面圖片來源:視覺中國
如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP