全球前沿科技亮“劍鋒”,杭州何以搶灘大模型之爭(zhēng)
2024-08-05 15:36:28 世界浙商
當(dāng)前,全球技術(shù)創(chuàng)新步入密集活躍期,國(guó)內(nèi)“百模大戰(zhàn)”酣戰(zhàn)一年格局初顯,人工智能大模型整體呈現(xiàn)爆發(fā)式發(fā)展,逐漸成為產(chǎn)業(yè)新型基礎(chǔ)設(shè)施,加速轉(zhuǎn)動(dòng)商業(yè)化應(yīng)用齒輪。
大勢(shì)之下,讓我們一起探尋全球大模型生態(tài)的發(fā)展步伐與涌現(xiàn)了哪些強(qiáng)悍的大模型,崛起了哪些新興應(yīng)用?以杭州為代表的國(guó)內(nèi)城市又是如何搶灘大模型陣地,打造新質(zhì)生產(chǎn)力加速發(fā)展的重要“引擎”?
一、溯源進(jìn)階:科技巨頭引領(lǐng)全球創(chuàng)新潮流
大模型的提出與實(shí)踐標(biāo)志著人工智能的研究步入了通用人工智能時(shí)代,已成為新一代人工智能產(chǎn)業(yè)的核心驅(qū)動(dòng)力,成為全球科技競(jìng)爭(zhēng)的新高地、未來產(chǎn)業(yè)的新賽道、經(jīng)濟(jì)發(fā)展的新引擎。
追溯AI大模型的發(fā)展進(jìn)程,2017年,Google提出基于自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)——Transformer架構(gòu),奠定了大模型預(yù)訓(xùn)練算法架構(gòu)的基礎(chǔ)。次年,OpenAI和Google分別發(fā)布了GPT-1與BERT大模型,預(yù)訓(xùn)練大模型成為自然語(yǔ)言處理領(lǐng)域的主流。
圖:大模型技術(shù)迭代歷程 來源:《人工智能圖景展望:躍遷點(diǎn)來臨(2023)》
2022年,AIGC初步呈現(xiàn)爆發(fā)態(tài)勢(shì)。其中,最引發(fā)市場(chǎng)關(guān)注的是Stable Diffusion和ChatGPT。
Stable Diffusion文本轉(zhuǎn)圖像模型于2022年10月發(fā)布,推動(dòng) AI繪畫作品風(fēng)靡一時(shí)。當(dāng)年年底,ChatGPT驚艷問世,其人機(jī)文本對(duì)話功能和文本創(chuàng)作能力將機(jī)器水平推向新高,代表AI家族率先撕下“人工智障”的標(biāo)簽,被視作通往通用人工智能的一條重要路徑,在全球范圍里掀起了一輪AIGC創(chuàng)新熱潮,開啟“人機(jī)互生”新階段。
一年前的3月15日成為AIGC時(shí)代來臨的關(guān)鍵節(jié)點(diǎn)。OpenAI發(fā)布多模態(tài)預(yù)訓(xùn)練大模型GPT-4,由此引發(fā)了全球科技巨頭“互掰手腕”、中國(guó)市場(chǎng)“百模大戰(zhàn)”的連鎖反應(yīng)。
隨后,OpenAI又在2024年初輸出了現(xiàn)象級(jí)“爆款”——視頻生成大模型 Sora,60s一鏡到底的電影級(jí)視頻“硬控”了每一位見證者。
相比之下,Sora在ChatGPT的基礎(chǔ)上增添了時(shí)空要素,為萬(wàn)物的涌現(xiàn)生成提供了條件和機(jī)遇,被冠以“世界模擬器”之稱。它通過想象力和創(chuàng)造力的融合表達(dá),可自行“腦補(bǔ)”人事物在物理世界中的存在方式,對(duì)視頻進(jìn)行向前或者向后的拓展,將對(duì)電影創(chuàng)作、廣告創(chuàng)意、游戲開發(fā)和教育培訓(xùn)等領(lǐng)域產(chǎn)生深遠(yuǎn)影響。
圖:國(guó)內(nèi)外大模型基座發(fā)展示意圖 來源:《大模型關(guān)鍵技術(shù)與未來發(fā)展方向——從 ChatGPT 談起》
從全球范圍看,世界各地積極推動(dòng)大模型研發(fā)和應(yīng)用,美國(guó)、中國(guó)是主要“玩家”,而英國(guó)、加拿大、新加坡等國(guó)家和地區(qū)尚處于前期嘗試階段,僅個(gè)別頭部企業(yè)開始應(yīng)用。
現(xiàn)階段,國(guó)外大模型領(lǐng)域主要呈現(xiàn)三大發(fā)展模式,包括“龍頭大模型+原有業(yè)務(wù)”、“龍頭大模型+外部行業(yè)數(shù)據(jù)”、“開源大模型+自有行業(yè)數(shù)據(jù)搭建行業(yè)大模型”,最具代表性的有OpenAI模式、微軟模式、谷歌模式等,已在自然語(yǔ)言處理、計(jì)算機(jī)視覺、智能語(yǔ)音等領(lǐng)域取得了標(biāo)志性技術(shù)突破,在模型精度、通用性和泛化能力等方面實(shí)現(xiàn)了跨越式發(fā)展。
二、大模型之爭(zhēng):“千模大戰(zhàn)”與“四省爭(zhēng)霸”
大模型之爭(zhēng)在國(guó)內(nèi)產(chǎn)業(yè)界日趨“白熱化”,“百模大戰(zhàn)”逐漸演變?yōu)?ldquo;千模大戰(zhàn)”。
相比國(guó)外大模型“龍頭效應(yīng)”顯著,國(guó)內(nèi)大模型的發(fā)展模式主要包括“自有通用大模型+外部行業(yè)數(shù)據(jù)”以及“自有或其他開源大模型+自有行業(yè)數(shù)據(jù)”。
而根據(jù)應(yīng)用場(chǎng)景和目標(biāo)人群的不同,大模型可分為通用大模型和行業(yè)大模型兩大類。我國(guó)具有代表性的通用大模型主要包含百度“文心一言”、阿里巴巴“通義千問”、科大訊飛“訊飛星火認(rèn)知”等;行業(yè)大模型主要涵蓋蜜度“文修”、容聯(lián)云“赤兔”、用友“YonGPT”等。根據(jù)運(yùn)行載體不同形成了端側(cè)和云側(cè)大模型,如端云結(jié)合的有vivo“藍(lán)心”大模型,端側(cè)主要以蔚來“NOMI GPT”大模型為代表。
截至目前,國(guó)內(nèi)AI大模型市場(chǎng)尚未出現(xiàn)爆款級(jí)應(yīng)用,其紅利和貢獻(xiàn)還遠(yuǎn)未被發(fā)掘。下一步,從基礎(chǔ)研究角度看, 更強(qiáng)的自主可控和建模能力是我國(guó)下一代大模型技術(shù)基礎(chǔ)研究的兩大核心任務(wù)。同時(shí), 2024年被業(yè)內(nèi)賦予“大模型場(chǎng)景落地元年”的期待,大模型技術(shù)加速朝著多模態(tài)、自主智能、邊緣智能演進(jìn),推進(jìn)更多樣性功能、更逼真應(yīng)用效果以及更友好的用戶體驗(yàn),探索走進(jìn)千家萬(wàn)戶、千行百業(yè)的新路徑。
圖:基于大語(yǔ)言模型的多模態(tài)大模型通用結(jié)構(gòu) 來源:《大模型關(guān)鍵技術(shù)與未來發(fā)展方向——從 ChatGPT 談起》
大模型不僅在行業(yè)內(nèi)“爭(zhēng)奇斗艷”,也在城市之間“打”得火熱,托舉中國(guó)大模型實(shí)力穩(wěn)居全球第一梯隊(duì)。
據(jù)中國(guó)信息通信研究院近期發(fā)布的《全球數(shù)字經(jīng)濟(jì)白皮書》顯示,全球人工智能大模型數(shù)量為1328個(gè),美國(guó)位居第一位,占比44%,位居第二位的中國(guó)大模型數(shù)量占比為36%。
其中,根據(jù)《中國(guó)人工智能大模型地圖研究報(bào)告》分析顯示,全國(guó)14個(gè)省市/地區(qū)均在開展大模型研發(fā),北京、廣東、浙江、上海等地的大模型數(shù)量最多,也是將近三年人工智能服務(wù)器采購(gòu)數(shù)量最高的地區(qū)。
截至2024年3月28日,通過國(guó)家互聯(lián)網(wǎng)信息辦公室備案的大模型名單有117個(gè),其中,北京51個(gè),上海24個(gè),廣東19個(gè),浙江9個(gè),大模型數(shù)量占全國(guó)總模型數(shù)量的88%。
北京占據(jù)AI大模型的“半壁江山”,其中“百模大戰(zhàn)”的第一槍正是由北京百度網(wǎng)訊科技有限公司打響。
2023年3月,百度生成式AI產(chǎn)品“文心一言”正式邀請(qǐng)測(cè)試。作為國(guó)內(nèi)首個(gè)公布的AI通用大模型,文心一言在“芯片-框架-模型-應(yīng)用”四層架構(gòu)進(jìn)行了全棧布局,在文學(xué)創(chuàng)作、文案創(chuàng)作、搜索問答、多模態(tài)生成、數(shù)理邏輯推算等方面已有應(yīng)用面向用戶開放。
圖:浙江省生成式人工智能服務(wù)已備案信息 制圖:“中國(guó)視谷”融媒體中心
浙江則是大模型孕育的繁榮之地、大模型應(yīng)用的領(lǐng)先之地。截至2024年4月29日,浙江已備案如阿里巴巴“通義千問”、新華三“百業(yè)靈犀”、同花順“問財(cái)”等11項(xiàng)生成式人工智能服務(wù)。還有一大批垂直類大模型以及處于內(nèi)測(cè)、未開放給公眾的大模型不斷壯大。
綜合來看,浙江省泛人工智能企業(yè)主要集中在環(huán)杭州灣地區(qū),省內(nèi)現(xiàn)有大模型也大多數(shù)誕生于杭州,來自“中國(guó)視谷”產(chǎn)業(yè)生態(tài)企業(yè),成為了杭州助力浙江加快培育新質(zhì)生產(chǎn)力的強(qiáng)大引擎。
圖:“中國(guó)視谷”精神堡壘
“中國(guó)視谷”作為杭州全力打造的國(guó)家經(jīng)濟(jì)地理新地標(biāo),正以“三層七端多元”產(chǎn)業(yè)體系為引領(lǐng),前瞻布局一批大模型相關(guān)未來產(chǎn)業(yè)。例如突破發(fā)展超大模型類腦計(jì)算,培育類腦計(jì)算自主框架和算法平臺(tái),將推進(jìn)知識(shí)增強(qiáng)、跨模態(tài)統(tǒng)一建模、提示學(xué)習(xí)、持續(xù)學(xué)習(xí)等技術(shù)在超大模型中的創(chuàng)新應(yīng)用,加快超大模型在機(jī)器視覺、多模態(tài)、人機(jī)交互等領(lǐng)域應(yīng)用。同時(shí),鼓勵(lì)龍頭企業(yè)、科研院所開展多模態(tài)通用大模型研發(fā)并向中小企業(yè)開放模型應(yīng)用,圍繞模型開發(fā)搭建開源開放平臺(tái)(社區(qū)),構(gòu)建基于開源開放技術(shù)的軟件、硬件、數(shù)據(jù)、應(yīng)用協(xié)同的產(chǎn)業(yè)生態(tài)。
三、城市案例:杭州打造“模型即服務(wù)”新模式
當(dāng)前,杭州加速引領(lǐng)全省人工智能產(chǎn)業(yè)的特色化發(fā)展,推進(jìn)“模型即服務(wù)”新模式,支持頭部企業(yè)開展多模態(tài)通用大模型關(guān)鍵技術(shù)攻關(guān)、中小企業(yè)深耕垂直領(lǐng)域做精專用模型,鼓勵(lì)相關(guān)技術(shù)和算法開源開放,推動(dòng)“中國(guó)視谷”產(chǎn)業(yè)生態(tài)企業(yè)合力探索大模型的商業(yè)化應(yīng)用進(jìn)程,形成“1+N+X”的協(xié)同創(chuàng)新、雙向賦能產(chǎn)業(yè)生態(tài)。
圖:MaaS模式下的AGI基礎(chǔ)業(yè)態(tài)分析 來源:《人工智能圖景展望:躍遷點(diǎn)來臨(2023)》
例如阿里巴巴“通義千問”已迭代2.5版本,落地應(yīng)用速度不斷加快,賦能天文、PC、文旅、航空、礦業(yè)等多個(gè)領(lǐng)域。根據(jù)阿里云公布的最新數(shù)據(jù),目前通義大模型已經(jīng)服務(wù)超9萬(wàn)家企業(yè),通義開源模型累計(jì)下載量突破700萬(wàn)。
圖:通義千問”已迭代2.5版本 來源:阿里巴巴
“達(dá)到GPT4級(jí)的國(guó)產(chǎn)大模型主動(dòng)開源,拉平了開源、閉源模型之間的差距,讓普通開發(fā)者也能用上最好的AI模型,大大加速了大模型的應(yīng)用落地進(jìn)程。”阿里云CTO周靖人表示,開源開放戰(zhàn)略將為大模型服務(wù)企業(yè)帶來新的商業(yè)增長(zhǎng)。
新華三集團(tuán)則一直積極推動(dòng)智能算力的創(chuàng)新與發(fā)展,秉持“1+N”大模型策略,以國(guó)內(nèi)首發(fā)的私域大模型百業(yè)靈犀(LinSeer)為基礎(chǔ),開放合作了N個(gè)業(yè)界優(yōu)秀的通用大模型和行業(yè)細(xì)分大模型,為垂直行業(yè)和專屬地域客戶提供訂制、獨(dú)享、生長(zhǎng)的智能化服務(wù)。為推動(dòng)大模型、AIGC等應(yīng)用與政企豐富場(chǎng)景的深度融合,新華三業(yè)已率先推出了AIGC靈犀一體機(jī)。
圖:靈犀大模型 來源:新華三
再看宇視科技的“梧桐”大模型。2023年,宇視領(lǐng)先AIoT行業(yè)率先推出了“梧桐”,并與多家行業(yè)龍頭聯(lián)合啟動(dòng)“梧桐大模型種子合作伙伴計(jì)劃”,探索大模型在交通、教育、零售、體育公共服務(wù)等領(lǐng)域的端邊云側(cè)的深入落地。經(jīng)過一年的技術(shù)迭代和生態(tài)共建,宇視又推出了升級(jí)版AIoT行業(yè)大模型“梧桐2.0”,并發(fā)布“獵光2.0”AI-ISP圖像引擎感知終端等一系列大模型產(chǎn)品,打響了AIoT行業(yè)“裝備大模型化”的第一槍。
宇視科技創(chuàng)始人、總裁張鵬國(guó)認(rèn)為,“大模型技術(shù)是AIoT行業(yè)當(dāng)下最大的技術(shù)變量,必定會(huì)帶來新的市場(chǎng)機(jī)會(huì)點(diǎn)。一個(gè)大的機(jī)會(huì)點(diǎn)就是大量在網(wǎng)產(chǎn)品的更新迭代。借助于行業(yè)大模型技術(shù),邊、端產(chǎn)品有望用更低的成本,在某些細(xì)分場(chǎng)景下實(shí)現(xiàn)更好的應(yīng)用效果。”
此外,還有海康“觀瀾”,大華“星漢”、安恒信息“恒腦·安全垂域大模型”、恒生電子“Light-GPT”、實(shí)在智能“塔斯”, 以及致力于大模型與智能體技術(shù)普惠落地的聯(lián)匯科技,近期全新發(fā)布了第二代思考大模型OmChatV2,推出了第二代多模態(tài)智能體OmAgent,并完成了與多款國(guó)產(chǎn)GPU的適配與性能驗(yàn)證。
由此可見,杭州的大模型生態(tài)呈現(xiàn)“百花齊放”的態(tài)勢(shì),充分發(fā)揮了鏈主作用,并部署集聚更多國(guó)內(nèi)軟硬件設(shè)備廠商、核心元器件廠商、解決方案應(yīng)用商協(xié)同發(fā)展,共同做強(qiáng)做優(yōu)做大智能物聯(lián)產(chǎn)業(yè)集群。
四、展望未來:算力像水電即取即用
無(wú)論是技術(shù)演進(jìn)還是應(yīng)用升級(jí),大模型的發(fā)展仍是強(qiáng)調(diào)人工智能技術(shù)變革的本質(zhì)——算法、數(shù)據(jù)、算力三大核心要素。
算力資源的稀缺性是制約大模型發(fā)展的關(guān)鍵瓶頸,芯片作為AI的“超級(jí)大腦”便顯得尤為重要。
今年,英偉達(dá)創(chuàng)始人、CEO 黃仁勛在 2024 年 COMPUTEX 科技大會(huì)上官宣了最新量產(chǎn)版的Blackwell芯片。這是英偉達(dá)首個(gè)采用多芯片封裝設(shè)計(jì)的 GPU,在同一個(gè)芯片上集成了兩個(gè) GPU,可以與英偉達(dá)Grace中央處理器組合配對(duì),最終創(chuàng)建GB200超級(jí)芯片。
圖:NVIDIA Grace CPU 超級(jí)芯片 來源:英偉達(dá)
基于英偉達(dá)芯片“一卡難求”的現(xiàn)狀,我國(guó)本土的高性能芯片形成了以華為海思、寒武紀(jì)、地平線、昆侖芯等為代表的龍頭引領(lǐng),部分解決方案正逐漸替代英偉達(dá)成為科技大廠的優(yōu)選,但仍與國(guó)際頂尖水平存在一定差距。
在數(shù)據(jù)對(duì)比上,國(guó)內(nèi)AI 大模型數(shù)據(jù)來源于互聯(lián)網(wǎng)、電商、社交、搜索等渠道,存在數(shù)據(jù)類型不全面、信息可信度不高、中文數(shù)據(jù)庫(kù)體量不足,以及有效數(shù)據(jù)源呈現(xiàn)碎片化分散狀態(tài)等問題。
總體而言,大模型的爆發(fā)式發(fā)展面臨著算力限制和高質(zhì)量訓(xùn)練數(shù)據(jù)集匱乏兩大難題,有望倒逼算力基礎(chǔ)設(shè)施建設(shè)加強(qiáng),以及數(shù)據(jù)在大規(guī)模、多模態(tài)、高質(zhì)量三大維度上的全面提升。
作為國(guó)家新一代人工智能創(chuàng)新發(fā)展試驗(yàn)區(qū)和國(guó)家人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū),杭州市圍繞促進(jìn)人工智能與實(shí)體經(jīng)濟(jì)深度融合這一主線,去年出臺(tái)了《關(guān)于加快推進(jìn)人工智能產(chǎn)業(yè)創(chuàng)新發(fā)展的實(shí)施意見》《關(guān)于高標(biāo)準(zhǔn)建設(shè)“中國(guó)視谷”高質(zhì)量發(fā)展視覺智能產(chǎn)業(yè)的實(shí)施意見》等系列政策。
文件顯示,杭州的目標(biāo)是到2025年基本形成“高算力+強(qiáng)算法+大數(shù)據(jù)”的產(chǎn)業(yè)生態(tài),打造成為全國(guó)算力成本洼地、模型輸出源地、數(shù)據(jù)共享高地,人工智能創(chuàng)新應(yīng)用水平全國(guó)領(lǐng)先、國(guó)際先進(jìn)。
聚焦算力層面來看,杭州一要建設(shè)算力中心,創(chuàng)建國(guó)家公共算力開放平臺(tái),打造算力高地和模型輸出高地;二要推進(jìn)算力供給市政化,全市每年設(shè)立總額不超過5000萬(wàn)元的“算力券”,重點(diǎn)支持中小企業(yè)購(gòu)買算力服務(wù)。
以此為導(dǎo)向,杭州算力增幅動(dòng)作頻頻,將有效降低企業(yè)使用算力的成本和門檻。
例如,1月25日,在“中國(guó)視谷”建設(shè)主陣地蕭山區(qū),視谷產(chǎn)業(yè)生態(tài)企業(yè)新華三集團(tuán)與政府共建的人工智能新高地圖靈小鎮(zhèn)正式啟用AIGC智算中心,規(guī)模可以達(dá)到2300P,相當(dāng)于100萬(wàn)臺(tái)PC電腦的算力,打破了過去算力分散且成本高昂的瓶頸。同時(shí),蕭山也設(shè)立了5000萬(wàn)元“算力券”,向企業(yè)發(fā)放相關(guān)補(bǔ)助,單個(gè)主體最高補(bǔ)貼金額可達(dá)200萬(wàn)元。
與此同時(shí),“中國(guó)視谷”核心區(qū)之一高新區(qū)(濱江)也于6月上線杭州人工智能計(jì)算中心三期,進(jìn)一步落地“算力券”和免費(fèi)適配等一系列鼓勵(lì)使用自主創(chuàng)新算力的措施,培育“高算力+強(qiáng)算法+大數(shù)據(jù)”的產(chǎn)業(yè)新生態(tài)。計(jì)算中心成立兩年來,推動(dòng)人工智能與大模型技術(shù)的集聚發(fā)展與創(chuàng)新應(yīng)用,已服務(wù)企業(yè)和組織機(jī)構(gòu)160余家,聯(lián)合了浙江大學(xué)等十余所高校與科研院所深入創(chuàng)新,成功孵化超過50個(gè)行業(yè)大模型和應(yīng)用創(chuàng)新。
搶灘未來,杭州這座數(shù)字之城加快實(shí)施“人工智能+”行動(dòng)推進(jìn)數(shù)字經(jīng)濟(jì)二次攀登、五大產(chǎn)業(yè)生態(tài)圈提能增效,推動(dòng)以大模型為代表的新技術(shù)加速規(guī)模化、體系化發(fā)展,在“中國(guó)視谷”的建設(shè)進(jìn)展中不斷孕育發(fā)展新質(zhì)生產(chǎn)力的關(guān)鍵變量。有朝一日,算力或許如水電一般即取即用,AIGC步入新一輪爆發(fā)期,人工智能全面賦能新型工業(yè)化,推動(dòng)人類社會(huì)快速邁入高度智能化時(shí)代。