存算一體作為先進計算技術(shù),從架構(gòu)上突破馮·諾依曼架構(gòu)存儲和計算分離導(dǎo)致的存儲墻和功耗墻問題,可大幅提升算力和能效水平,在AI時代的重要性日益凸顯。
中國移動自2021年起開展存算一體技術(shù)研究,并與高校和產(chǎn)業(yè)伙伴聯(lián)合推動存算一體多技術(shù)路線探索和研發(fā)。2022年提出“如何實現(xiàn)存算一體芯片工程化和產(chǎn)業(yè)化”提案,并獲評為中國科協(xié)“10個對產(chǎn)業(yè)發(fā)展具有引領(lǐng)作用的產(chǎn)業(yè)技術(shù)問題”之一;同年,聯(lián)合清華大學(xué)研發(fā)業(yè)界首款基于憶阻器的110nm制程存算一體SoC芯片,單芯片憶阻器集成規(guī)模突破300萬,算力能效較相同工藝下的主流GPU提升2個數(shù)量級,達業(yè)內(nèi)領(lǐng)先水平。但從產(chǎn)業(yè)維度來看存算一體目前仍處于初級發(fā)展階段,主要廠商多聚焦在芯片研發(fā)層面,而在產(chǎn)業(yè)鏈其他環(huán)節(jié)難以集中力量開展布局,導(dǎo)致缺乏成熟的軟件工具鏈和模型適配算法,缺少典型性的應(yīng)用引領(lǐng)及相關(guān)的測試驗證標(biāo)準(zhǔn)平臺,產(chǎn)業(yè)生態(tài)構(gòu)建存在諸多困難。
面對存算一體產(chǎn)業(yè)發(fā)展的挑戰(zhàn),中國移動聯(lián)合清華大學(xué)等高校和智存科技等頭部企業(yè),圍繞軟件、算法、應(yīng)用環(huán)節(jié)的短板精準(zhǔn)發(fā)力:在軟件方面,研發(fā)了適配存算一體芯片的半自動化軟件計算引擎,支持面向存算一體計算架構(gòu)的AI模型編譯、算子編排、模型部署和推理以及芯片性能模擬等功能,有效降低用戶開發(fā)和部署門檻,開發(fā)調(diào)試效率提升3倍以上。在算法方面,針對存算一體器件規(guī)模受限和模擬計算誤差的問題,提出面向存算一體的模型壓縮、誤差補償和加噪訓(xùn)練等適配算法,在保證計算準(zhǔn)確性的同時將模型規(guī)模縮減至1/16,實現(xiàn)AI模型在存算一體芯片的高效、準(zhǔn)確和魯棒運行。在應(yīng)用驗證方面,實現(xiàn)存算一體芯片與自研的5G工業(yè)網(wǎng)關(guān)的硬件系統(tǒng)集成,并通過自研的軟件計算引擎輔助實現(xiàn)了多種人工智能模型的自動部署和推理,在衛(wèi)星圖像分類、PCB板質(zhì)檢等場景完成應(yīng)用驗證:其中衛(wèi)星圖像識別準(zhǔn)確率達96%以上,PCB板質(zhì)檢實現(xiàn)5種常見元件的精準(zhǔn)識別和定位,并支持3種以上微小瑕疵的自動檢測。
本次端對端技術(shù)驗證是存算一體由技術(shù)研究邁向產(chǎn)業(yè)應(yīng)用的關(guān)鍵環(huán)節(jié),中國移動作為移動信息產(chǎn)業(yè)鏈鏈長,將持續(xù)發(fā)揮產(chǎn)業(yè)引領(lǐng)作用,推進產(chǎn)學(xué)研用合作,積極構(gòu)建自主可控的存算一體新型算力生態(tài)。