日本一区二区三区久久久,午夜视频免费在线,喑交小拗女一区二区三区,91麻豆免费,77777日本少妇久7黄绝片,日b免费视频,国产精品去看片

每日經(jīng)濟新聞
推薦

每經(jīng)網(wǎng)首頁 > 推薦 > 正文

參數(shù)競賽趨于冷靜 微博為何選擇在此時推出自研大模型?

2025-11-19 19:44:02

11月18日,微博發(fā)布首個自研開源大模型“VibeThinker”,規(guī)模僅15億參數(shù)。微博AI研發(fā)負責人稱,此舉旨在回歸核心場景,不盲目追求算力比拼。當前大模型廠商主流選擇仍是增加參數(shù)量,但微博方面認為小模型有響應快、成本低等優(yōu)勢。VibeThinker或率先用于評論羅伯特,未來計劃擴展至搜索等場景。

每經(jīng)記者|可楊    每經(jīng)編輯|魏官紅    

當大模型競爭從參數(shù)規(guī)模轉向落地成效,微博下場了。

11月18日,微博發(fā)布其首個自研開源大模型“VibeThinker”,模型規(guī)模僅15億參數(shù),訓練成本被控制在約7800美元。

在大模型成本與資源壁壘不斷被拉高之際,為何微博選擇在此時入場?其選擇的輕量化技術路徑是否意味著大模型競爭已出現(xiàn)新的分叉?

11月19日,微博AI(人工智能)研發(fā)負責人在接受《每日經(jīng)濟新聞》記者(以下簡稱“每經(jīng)記者”)采訪時表示,微博并不是要和行業(yè)頭部比拼算力,而是回到微博的核心場景,把真正有效的能力沉淀下來。他認為,大模型不必一味追求規(guī)模增大,而應圍繞內容理解、用戶興趣分層、文本生成等關鍵場景進行針對性訓練。

在用戶增長趨穩(wěn)、信息流分發(fā)效率成為競爭焦點的背景下,自研模型既是技術選擇,也是一種商業(yè)變量。更關鍵的問題在于:微博的輕量化路線能否真正帶來平臺體驗或商業(yè)化效率的改善?

押注小模型:VibeThinker背負成本優(yōu)化期待

當前,通過增加參數(shù)量來提升模型能力依舊是大模型廠商們的主流選擇,部分前沿模型的參數(shù)規(guī)模已超過萬億級,埃隆·馬斯克旗下的xAI計劃明年初發(fā)布的Grok 5預計會把模型參數(shù)規(guī)模推高到6萬億左右。

微博AI研發(fā)負責人對每經(jīng)記者表示,無論是從模型制作成本、AI應用成本、技術開放性等方面,這種模式都是不可持續(xù)的。

站在推動AI應用普惠的角度,已有廠商在大模型技術“摸高”的同時,開始將目光轉向小模型。

上述研發(fā)負責人指出,業(yè)界普遍認為小模型在解決復雜任務和邏輯推理方面存在天生劣勢,這也是阻礙其廣泛應用的核心障礙。但他進一步解釋道,小模型在實際應用中具有天然優(yōu)勢:模型規(guī)模較小意味著服務響應更快、計算成本更低,同時更易于在特定場景下進行優(yōu)化。

“我們在實際AI應用中發(fā)現(xiàn),模型規(guī)模過大導致服務慢、成本高、用戶體驗差等,這促使我們探究小模型復雜邏輯能力的問題??經(jīng)過一些針對性的探索和技術改進,小模型經(jīng)過行業(yè)特有數(shù)據(jù)和合理訓練方法,也可以具備強大的邏輯推理能力?!蔽⒉〢I研發(fā)負責人表示。

記者注意到,在整體業(yè)績增速放緩的背景下,微博正通過AI應用尋找新的增長路徑。

財報顯示,微博三季度凈收入為4.42億美元,同比下降5%,歸屬于公司股東的凈利潤達到2.21億美元,高于去年同期的1.31億美元。

數(shù)據(jù)背后,AI應用正在發(fā)揮越來越重要的作用:三季度,微博智搜MAU突破7000萬,DAU和檢索量環(huán)比增長超過50%,搜索總檢索量環(huán)比提升20%。AI技術正在成為微博推動搜索生態(tài)增長、增強平臺活躍度的重要工具。

“評論羅伯特”成小模型實驗場

VibeThinker未來在微博的首要落地場景,很可能是其最為出圈的官方評論機器人“評論羅伯特”。

2023年底,微博推出“評論羅伯特”,目標是在用戶發(fā)帖后自動生成評論,以活躍社交氛圍為核心。它自稱是“天生的捧哏”“有趣的靈魂”“不知疲倦的顯眼包”,被網(wǎng)友戲稱為“賽博街溜子”。

微博用戶“張俊林say”(微博AI研發(fā)人員)在其微博中提到,團隊在研發(fā)評論工具“羅伯特”過程中,充分挖掘了微博豐富的心理學領域數(shù)據(jù),增強了模型在心理指導和情感撫慰上的能力。今年初,隨著DeepSeek-R1開源論文中強化學習方法的公布,團隊進一步制作了針對評論場景的深度思考訓練數(shù)據(jù),并訓練Reward模型,推出深度思考版本的羅伯特。

然而,基座模型體量龐大,深度思考過程耗時且成本高昂。這也正是VibeThinker誕生的初衷:探索一種邏輯推理能力同樣出色、但規(guī)模更小的模型,替代大模型,使每條評論都能經(jīng)過深度思考。換言之,VibeThinker并非直接作為評論羅伯特的底層模型,但其研發(fā)起點源于優(yōu)化評論應用的實際需求。

盡管VibeThinker已對外開源,但上述微博AI研發(fā)負責人在接受每經(jīng)記者采訪時強調,VibeThinker仍處于實驗階段,尚未在實際產品中大規(guī)模應用。當前開源版本主要側重展示模型在邏輯推理、競賽數(shù)學和編程能力方面的潛力?!坝行┤藭J為這是一種垂直領域的能力增強,這是一種誤解,邏輯推理能力目前是大模型最關鍵的能力,而這種能力的提升會帶動模型解決現(xiàn)實場景的復雜問題?!?/p>

同時,上述負責人表示,未來,VibeThinker將計劃在To C產品中首先應用,尤其是在“評論羅伯特”這種能體現(xiàn)出微博數(shù)據(jù)優(yōu)勢和特色的應用中采用,利用在微博中挖掘的優(yōu)質領域數(shù)據(jù)來調整VibeThinker,然后考慮逐步擴展到搜索、推薦等大量消耗算力的場景。

封面圖片來源:圖片來源:每日經(jīng)濟新聞 資料圖

如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0