在日前舉辦的2024 vivo開發(fā)者大會上,vivo高級副總裁、首席技術(shù)官施玉堅(jiān)表示,在過去三年和今年前三季度,vivo始終穩(wěn)居國產(chǎn)手機(jī)銷量第一。去年,vivo推出了自己的技術(shù)品牌——“藍(lán)科技”。藍(lán)科技是從應(yīng)用創(chuàng)新扎根到底層技術(shù)創(chuàng)新,從硬件驅(qū)動(dòng)到形成軟硬件一體化能力,這是vivo基于用戶需求,所構(gòu)建的技術(shù)研發(fā)體系。其包含了“藍(lán)圖影像”、“藍(lán)海續(xù)航系統(tǒng)”、“藍(lán)晶芯片技術(shù)?!币约叭律壍摹八{(lán)心大模型”和“藍(lán)河操作系統(tǒng)”。
在此次大會上,vivo正式發(fā)布全新AI戰(zhàn)略——“藍(lán)心智能”,同時(shí)帶來全面升級的自研藍(lán)心大模型矩陣、原系統(tǒng)5(OriginOS 5)、藍(lán)河操作系統(tǒng)2(BlueOS 2)等等。
早在去年,端側(cè)AI便成為各大手機(jī)終端廠商進(jìn)行手機(jī)創(chuàng)新的主航道,彼時(shí)大家都將AI端側(cè)大模型的參數(shù)集中于7B。然而參數(shù)越大所需的處理器、存儲等資源越多,輕量化小模型或許更適合于智能終端,但是否AI性能會打折扣呢。vivo最新推出的3B小模型給出了答案。
正如vivo對于藍(lán)心大模型的定位是,通過豐富中文數(shù)據(jù)與知識的供給,把藍(lán)心大模型做成最懂中國人的大模型。我們可以看到,無論是中文詩句的文生圖、方言的采集與支持等等,vivo的一系列底層技術(shù)的創(chuàng)新是實(shí)實(shí)在在踐行這一定位,并將智能手機(jī)AI帶到一個(gè)新的階段。
藍(lán)晶芯片技術(shù)棧升級,“天璣芯,看藍(lán)晶”
vivo一直專注SoC從定義、設(shè)計(jì)到研發(fā)調(diào)校的全鏈路技術(shù)閉環(huán),實(shí)現(xiàn)底層的“軟硬一體化”設(shè)計(jì),為芯片注入“vivo的靈魂”。
近年來,聯(lián)發(fā)科技發(fā)布的旗艦芯片,均由vivo旗艦手機(jī)首發(fā)搭載。隨著雙方合作的持續(xù)深化,vivo藍(lán)晶芯片技術(shù)棧也積累了強(qiáng)大的芯片調(diào)校經(jīng)驗(yàn),軟硬一體化打造最強(qiáng)綜合能效體驗(yàn),并在業(yè)界有了“天璣調(diào)校看藍(lán)廠”、“天璣芯,看藍(lán)晶”等美譽(yù)。
vivo X200系列將全球首發(fā)搭載天璣9400,vivo藍(lán)晶芯片技術(shù)棧深度調(diào)校,帶來“沖動(dòng)又冷靜”的最強(qiáng)綜合能效體驗(yàn)。
天璣9400的第二代全大核CPU架構(gòu)包含1個(gè)主頻高達(dá)3.62GHz的Cortex-X925超大核,以及3個(gè)Cortex-X4超大核和4個(gè)Cortex-A720大核,其單核性能相較上一代提升35%,多核性能提升28%。天璣9400采用臺積電第二代3nm制程,相較上一代同性能功耗降低40%。與此同時(shí),天璣9400搭載新一代旗艦12核GPU Immortalis-G925,其峰值性能相較上一代提升 41%,功耗節(jié)省44%,光線追蹤性能較上一代提升40%,游刃有余的性能將大幅提升游戲沉浸感。
vivo藍(lán)晶芯片技術(shù)棧的深度調(diào)校,在進(jìn)一步激發(fā)天璣9400強(qiáng)悍性能的同時(shí),也實(shí)現(xiàn)了更優(yōu)秀的能耗控制,達(dá)到高能效與低能耗的完美平衡。根據(jù)vivo產(chǎn)品經(jīng)理韓伯嘯發(fā)布的截圖顯示,搭載天璣9400的vivo X200系列,在安兔兔平臺跑出超300萬分的歷史新高,再次樹立安卓旗艦手機(jī)的性能標(biāo)桿。
vivo全新AI戰(zhàn)略“藍(lán)心智能”:AI與OS的深度融合
在此次大會上,vivo副總裁、OS產(chǎn)品副總裁、vivo AI全球研究院院長周圍正式發(fā)布了vivo的全新AI戰(zhàn)略——藍(lán)心智能。
藍(lán)心智能是將大模型技術(shù)與手機(jī)操作系統(tǒng)深度融合的個(gè)人智能。藍(lán)心智能可以理解用戶的個(gè)人情景和偏好,為用戶提供個(gè)人化的專屬服務(wù)。
vivo從三個(gè)方面用AI重構(gòu)系統(tǒng)體驗(yàn)。包括重構(gòu)人與設(shè)備的交互體驗(yàn),讓交互更自然更符合直覺。重構(gòu)人與數(shù)字世界的服務(wù)體驗(yàn),讓智能更加個(gè)人化,也就是構(gòu)建簡單高效的服務(wù)獲取能力和主動(dòng)服務(wù)能力,從而讓手機(jī)成為智能溫暖的個(gè)人助理。還有,重構(gòu)人與物理世界的連接體驗(yàn),讓溝通更順暢和溫暖。vivo利用多模態(tài)大模型,讓手機(jī)成為視障人士的眼睛,幫助他們可以獨(dú)自安全的走到更遠(yuǎn)的陌生的地方。
基于此,vivo基于藍(lán)心大模型技術(shù)做出的一次全新探索,即“PhoneGPT”也就是手機(jī)智能體。在演示中,藍(lán)心小V不僅可以對屏幕界面進(jìn)行識別和操作,也可以通過接管音頻進(jìn)行自主對話,以完成用戶交代的任務(wù),例如幫助我們?nèi)ビ啿蛷d、訂咖啡等等。這是手機(jī)自動(dòng)化的一小步,卻是解放用戶雙手的一大步。
未來,藍(lán)心智能將以藍(lán)心大模型矩陣為技術(shù)底座,繼續(xù)探索AI與OS的深度融合,持續(xù)打造開放共贏的智能體生態(tài)。
全新藍(lán)心大模型矩陣,3B端側(cè)大模型打破“不可能三角定律”
為進(jìn)一步夯實(shí)AI能力底座,vivo在今年的開發(fā)者大會上發(fā)布了全新自研藍(lán)心大模型矩陣。全面升級語言大模型和端側(cè)大模型能力,并帶來vivo自研的語音大模型、圖像大模型以及多模態(tài)大模型。這預(yù)示藍(lán)心智能,向著個(gè)人化和多元化發(fā)展邁出重要的一步。
在去年開發(fā)者大會上,vivo 發(fā)布了自研十億、百億、千億三個(gè)參數(shù)量級,由5款語言大模型組成的藍(lán)心大模型矩陣。并在行業(yè)中率先跑通了1B、7B、13B的端側(cè)大模型,同時(shí)基于藍(lán)心大模型推出了藍(lán)心小V和藍(lán)心千詢APP。截至今天,vivo的AI能力已覆蓋全球60多個(gè)國家和地區(qū),服務(wù)超過5億手機(jī)用戶,大模型token輸出量超過了3萬億個(gè)。
繼去年帶來了三款端側(cè)大模型之后,vivo正式發(fā)布全新30億參數(shù)量級的藍(lán)心端側(cè)大模型3B。
圖:電子發(fā)燒友網(wǎng)現(xiàn)場拍攝
在對話寫作、摘要總結(jié)、信息抽取等能力上,藍(lán)心3B可以越級比肩行業(yè)7B-9B模型。相比藍(lán)心7B,藍(lán)心 3B極致性能提升300%,平衡模式下功耗優(yōu)化達(dá)46%,極致出詞速度可以達(dá)到80字/s,系統(tǒng)功耗僅450mA,內(nèi)存占用僅1.4GB。在SuperCLUE和Equal Eval的小模型綜合能力評測中,藍(lán)心3B均排名第一,同時(shí)獲得了泰爾實(shí)驗(yàn)室端側(cè)大模型綜合能力認(rèn)證以及AIIA安全防范能力認(rèn)證。藍(lán)心端側(cè)大模型3B真正打破了“模型小、能力強(qiáng)、消耗低“的不可能三角定律”。
圖:電子發(fā)燒友網(wǎng)現(xiàn)場拍攝
據(jù)了解,vivo X200系列將全球首發(fā)LPDDR5X Ultra Pro內(nèi)存,為用戶帶去更強(qiáng)悍的手機(jī)性能體驗(yàn)。也就是說,采用參數(shù)量級更小的模型的同時(shí),內(nèi)存性能還頂格提升,這為智能手機(jī)的AI極致性能體驗(yàn)提供了巨大的空間。從另一方面來自,模型輕量化也有利于端側(cè)AI功能從旗艦手機(jī)向中低端智能手機(jī)的下放,對AI手機(jī)的普及起到至關(guān)重要的作用。
云端語言大模型升級方面,BlueLM-70B 2.0新增學(xué)習(xí)了1億知識問答,500w篇的論文,以及1.2億代碼倉庫等高質(zhì)量數(shù)據(jù),模型整體能力提升30%。新增了多模態(tài)多輪對話能力,支持400+手機(jī)系統(tǒng)工具和180+三方工具的調(diào)用,以及全面升級了大模型的代碼生成能力,能實(shí)現(xiàn)數(shù)理計(jì)算和Excel的數(shù)據(jù)分析能力。
語言大模型新增圖像理解能力,通過將文本、圖像抽象成統(tǒng)一的token表示,vivo為語言大模型新增了看世界的“眼睛”,能夠理解手機(jī)上的文字和圖片多種模態(tài)的信息。BlueLM-V-3B模型,領(lǐng)跑行業(yè)4B及以下的多模態(tài)大模型。
vivo自研語音大模型基于藍(lán)心文本大模型開發(fā),通過離散化編碼結(jié)合文本大模型學(xué)習(xí),實(shí)現(xiàn)更智能、豐富和簡單的語音交互。它具備四大核心能力:語音合成、音色復(fù)刻、語音翻譯和方言自由說。未來,vivo計(jì)劃將語音大模型能力逐步開放至智能體平臺,以更廣泛地服務(wù)于用戶和開發(fā)者。
vivo的文生圖大模型即藍(lán)心圖像大模型BlueLM-Art,精通中文語境,融合了中國特色與東方美學(xué),其在中文理解、中國文化詮釋、人物攝影美學(xué)及中文文字繪制等多個(gè)維度都取得了出色的效果,多次榮登SuperCLUE-Image基準(zhǔn)榜單中文領(lǐng)域榜首。
大模型時(shí)代,vivo持續(xù)推進(jìn)各模態(tài)大模型端側(cè)化能力建設(shè),探索大模型在各業(yè)務(wù)場景端側(cè)產(chǎn)品落地,覆蓋“聽、說、讀、寫、畫”各應(yīng)用場景。針對全模態(tài)大模型端側(cè)化,vivo 從算法模型設(shè)計(jì),到量化、性能瓶頸分析工具建設(shè),再到底層運(yùn)行時(shí)異構(gòu)方案設(shè)計(jì)和業(yè)務(wù)框架層靈活的多業(yè)務(wù)部署架構(gòu)建設(shè),提供了完整的解決方案。通過軟硬件協(xié)同,充分挖掘芯片潛力,確保大模型在端側(cè)運(yùn)行時(shí)的強(qiáng)悍性能。
AI落地三大挑戰(zhàn),訓(xùn)推一體架構(gòu)協(xié)同
vivo AI工程架構(gòu)專家陳崇沛分享vivo在大規(guī)模高性能計(jì)算領(lǐng)域的探索與創(chuàng)新。他指出,大規(guī)模訓(xùn)練、高性能推理及海量算力治理是AI落地面臨的三大挑戰(zhàn)。為此,vivo構(gòu)建了大模型工程體系,解決了大規(guī)模訓(xùn)練的問題,讓模型能按天迭代;解決高性能推理的問題,能秒級生成圖片;搭建了堅(jiān)如磐石的萬卡集群,算力能持續(xù)穩(wěn)定輸出。這一體系全面支撐了vivo各模態(tài)、模型的訓(xùn)練與推理,廣泛應(yīng)用于vivo的AI產(chǎn)品中。
展望未來,vivo要打造出強(qiáng)有力的個(gè)人化智能產(chǎn)品,就要具備o1這類強(qiáng)邏輯推斷能力的模型。而大模型工程的關(guān)鍵是性能和靈活性兼具的強(qiáng)化學(xué)習(xí)訓(xùn)練框架,這樣才能發(fā)揮出強(qiáng)化學(xué)習(xí)Scaling law的威力。為了實(shí)現(xiàn)這個(gè)目標(biāo),vivo的思路是:以訓(xùn)推一體架構(gòu)為基礎(chǔ),整合自研推理引擎和訓(xùn)練框架,滿足多模型訓(xùn)練推理協(xié)同的要求,支持高性能、高靈活性的自博弈強(qiáng)化學(xué)習(xí)。
-
vivo
+關(guān)注
關(guān)注
12文章
3303瀏覽量
63254
發(fā)布評論請先 登錄
相關(guān)推薦
評論