IT時報記者 郝俊慧
連續(xù)七屆參加世界人工智能大會的騰訊,再次將表達的重點放到“大模型行業(yè)和應用”上。
經(jīng)歷了一年半“技術(shù)狂飆”后,國產(chǎn)大模型的數(shù)量已經(jīng)超過200個,2024年也被稱為“大模型落地元年”。但作為國內(nèi)互聯(lián)網(wǎng)頭部大廠,騰訊始終走得不疾不徐。
“大模型的打造只是起點,把技術(shù)落地到產(chǎn)業(yè)場景,創(chuàng)造價值才是目標”,2024WAIC·騰訊論壇上,騰訊云副總裁、騰訊云智能負責人、騰訊優(yōu)圖實驗室負責人吳運聲表示,大模型的研發(fā)、應用必須關(guān)注、解決具體業(yè)務場景,以及可用性和性價比。
自2023年9月首次亮相以來,經(jīng)過多次迭代升級,騰訊混元大模型在國內(nèi)率先采用MoE架構(gòu),實現(xiàn)了性能大幅提升。據(jù)騰訊集團副總裁蔣杰介紹,截至目前,混元整體參數(shù)量已達到萬億,Tokens數(shù)量超過7萬億,居國內(nèi)大模型第一梯隊。
智能體“最火”
WAIC展覽期間,騰訊展區(qū)始終人頭攢動。在騰訊元寶片區(qū),現(xiàn)場觀眾可以通過互動裝置,生成個人多風格專屬頭像。
元寶是一款基于騰訊混元大模型開發(fā)的AI原生應用,擁有看、聽、說等多模態(tài)交互能力,提供AI搜索、AI總結(jié)、AI寫作一站式服務,可支持單文檔最長1000萬字的超長文處理,能夠一次性解析最多50個文件,支持上傳和解析包括 pdf、doc、txt、xlsx、pptx 在內(nèi)的多種文件格式。
從形式上看,騰訊元寶覆蓋工作提效、生活娛樂兩大場景,除了和文字相關(guān)的核心功能,元寶還可以提供創(chuàng)意繪畫、口語陪練、百變AI頭像等有趣好玩的特色應用,以及更多用戶創(chuàng)建的智能體。
智能體是今年WAIC上的新晉“網(wǎng)紅”。在“騰訊元器”展區(qū),參會嘉賓可以通過添加提示詞、插件、知識庫等自由創(chuàng)建智能體,也可以在智能體商店選擇、使用智能體,以滿足不同場景下的需求。
目前,騰訊在大模型領(lǐng)域已經(jīng)構(gòu)建了一套全鏈路產(chǎn)品矩陣,涵蓋從底層豐富基礎設施到頂層多元智能應用。包括自研通用大模型、模型開發(fā)平臺、智能體開發(fā)平臺,以及針對不同場景定制的智能應用解決方案等。通過這些產(chǎn)品和方案,致力于助力企業(yè)客戶高效地將大模型技術(shù)應用到實際業(yè)務場景中,實現(xiàn)快速部署和價值創(chuàng)造。
做離產(chǎn)業(yè)最近的AI
自從進入大模型賽道以來,騰訊始終堅持“產(chǎn)業(yè)實用”的核心戰(zhàn)略,構(gòu)建離產(chǎn)業(yè)最近的AI。
去年6月,騰訊云對外發(fā)布行業(yè)大模型解決方案,通過TI平臺打造全新模型精選商店,為客戶提供MaaS一站式服務,涵蓋模型預訓練、模型精調(diào)、智能應用開發(fā)等,大大降低模型應用及落地成本。
吳運聲認為,大模型的打造只是起點,把技術(shù)落地到產(chǎn)業(yè)場景、創(chuàng)造價值才是目標。他特別強調(diào)了大模型知識引擎在智能客服、營銷等多場景的落地應用,比如在客服場景,知識引擎可以融入到客服系統(tǒng),讓客服人員更準確、更高效率地解答客戶的問題;在產(chǎn)品營銷場景,知識引擎可以整合到騰訊企點營銷SCRM中,提供更優(yōu)質(zhì)的服務,提升客戶轉(zhuǎn)化率;在人才培訓場景,知識引擎可以結(jié)合騰訊樂享知識學習平臺,把員工的智慧聚集成企業(yè)知識庫,促進內(nèi)部知識分享和傳播。
作為支撐AI大模型的重要基礎設施,向量數(shù)據(jù)庫能突破大模型在時間和空間上的限制,加速大模型落地行業(yè)場景。
今年大會上,騰訊秀出了“肌肉”:騰訊云向量數(shù)據(jù)庫可支持千億級向量規(guī)模、五百萬QPS及毫秒級查詢延遲,專用于在搜索/推薦和AIGC場景中提供文檔、圖片、音視頻等非結(jié)構(gòu)化數(shù)據(jù)檢索服務。
從科技向善到AI普惠
大模型技術(shù)正在往多模態(tài)、零樣本學習、3D和視頻生成等方向快速演進,增強技術(shù)融合、簡化模型訓練流程、提供更加沉浸式體驗等方式,正在加速AI技術(shù)的普惠。
論壇當天,由安陽師范學院甲骨文信息處理教育部實驗室、騰訊SSV數(shù)字文化實驗室、騰訊優(yōu)圖實驗室、中國社會科學院甲骨學殷商史研究中心等單位共同發(fā)起建立的“數(shù)字甲骨共創(chuàng)中心”宣布,將全球最大的甲骨文多模態(tài)數(shù)據(jù)集正式開源。該數(shù)據(jù)集包含一萬片甲骨的拓片、摹本,以及甲骨單字對應位置、對應字頭、對應隸定字以及辭例分組、釋讀順序等數(shù)據(jù)?;谠摂?shù)據(jù)集,研究人員可開發(fā)甲骨文檢測、識別、摹本生成、字形匹配以及釋讀等方向的智能算法,助推甲骨文研究加速數(shù)字化和智能化。
近年來,隨著AI技術(shù)的快速發(fā)展,探索AI與甲骨文研究相結(jié)合,成為了研究人員的解題思路。但高質(zhì)量的AI算法非常依賴高質(zhì)量的甲骨文數(shù)據(jù)集。
此次開源的甲骨文多模態(tài)數(shù)據(jù)集集合了甲骨文數(shù)字化研究的最新成果。它吸收了當前業(yè)界最先進的甲骨文研究資料,包括劍橋大學博士秦培超發(fā)布的鏡元甲骨文字庫,該字庫考慮了人工智能標注需求的字庫進行了細粒度的異體字標識;以及清華大學黃天樹教授發(fā)布的《摹本大系》,得益于其具有大量甲骨片清晰字形,降低了標注的難度。
AI相關(guān)技術(shù)的應用也為數(shù)據(jù)集的信息豐富提供了支撐。比如由騰訊優(yōu)圖實驗室聯(lián)合安陽團隊開發(fā)的甲骨字檢測模型,可以對甲骨片上的字進行一個初步的標注;字形降噪與匹配模型,為檢索提供了最直接的方法;甲骨校重算法,可以實現(xiàn)拓片與大系摹本的配準,使得大系摹本可以直接輔助拓片的標注;同時雙方聯(lián)合打造的協(xié)同創(chuàng)新平臺,也大大提升了數(shù)據(jù)標注的效率。
中國社會科學院學部委員宋鎮(zhèn)豪表示,甲骨文是中華文明的重要瑰寶,甲骨文研究不僅有助于揭示中國上古信史,還能為現(xiàn)代漢字由來和漢語研究提供標志性依據(jù)。通過AI技術(shù)的應用,有望加快甲骨文探析進程,解決長期困擾學界的疑難問題。希望更多的科研機構(gòu)和專家學者加入到這一偉大事業(yè)中,共同拓展甲骨文研究工作新天地。
此外,在天文領(lǐng)域,“探星計劃”在“云+AI”的輔助下,整體探星信號處理效率提升1800倍,目前已發(fā)現(xiàn)41顆脈沖星,助力中國天文取得更多成果;以“AI+公益”為方向的Light技術(shù)公益平臺,開放騰訊云上300余項AI原子能力,以多種社會熱點議題為方向,號召各界人士共同打造技術(shù)公益解決方案。