下面是通知內(nèi)容:
當前大模型已呈現(xiàn)出產(chǎn)業(yè)生態(tài)不斷擴大、場景應用快速涌現(xiàn)、商業(yè)路徑逐步清晰等特點,成為現(xiàn)階段人工智能產(chǎn)業(yè)的技術創(chuàng)新主線。為進一步推動我國大模型技術創(chuàng)新發(fā)展及工程化應用落地,中國信息通信研究院(以下簡稱“中國信通院”)現(xiàn)啟動大模型技術及應用基準構(gòu)建工作,針對當前主流數(shù)據(jù)集和評估基準多以英文為主,缺少中文特點、文化以及難以滿足關鍵行業(yè)應用選型需求等問題,聯(lián)合業(yè)界主流創(chuàng)新主體共同構(gòu)建一套涵蓋多任務領域、多測評維度的基準及測評工具 AISHPerf-LargeModel,推動我國大模型技術及應用的引領創(chuàng)新。
AISHPerf-LargeModel 屬于人工智能軟硬件基準測評體系范疇(IT之家注:Performance Benchmarks of Artificial Intelligence Software and Hardware,以下簡稱 AISHPerf),AISHPerf 由中國信通院牽頭構(gòu)建,旨在面向自主生態(tài)建設和產(chǎn)業(yè)實際需求,圍繞 AI 芯片性能、算法任務表現(xiàn),構(gòu)建國產(chǎn)人工智能軟硬件領域的測試基準任務,推動相關技術發(fā)展。
中國信通院一直以來圍繞大模型展開深入的研究及產(chǎn)業(yè)培育,在此之前已開展多項工作:
一是大模型能力測評,圍繞自然語言處理、多模態(tài)技術能力以及系統(tǒng)平臺功能構(gòu)建共計 30 余項細分任務的評估體系,推動完成百度、中科院自動化所及武漢人工智能研究院、聯(lián)匯科技等創(chuàng)新主體的大規(guī)模預訓練模型系統(tǒng)能力測評;
二是發(fā)布大模型產(chǎn)業(yè)生態(tài)透視圖 V1.0.對當前大模型領域算力設施、基礎大模型、平臺及服務、大模型典型應用四大關鍵環(huán)節(jié)的主要創(chuàng)新主體進行了梳理,同時分析了大模型落地的關鍵應用模式及演進趨勢,目前,已啟動產(chǎn)業(yè)生態(tài)透視圖 V2.0 編制,歡迎業(yè)界共同參與;
三是依托工信部、科技部等主辦的“興智杯”全國人工智能創(chuàng)新應用大賽,設置基于大規(guī)模預訓練模型的創(chuàng)新應用方案賽,構(gòu)建大模型資源池,構(gòu)建一批能夠充分發(fā)揮大模型優(yōu)勢、解決領域痛點的創(chuàng)新解決方案。