綜合信息

當(dāng)前位置 >>

微電子所在數(shù)?；旌洗嫠阋惑w芯片方面取得重要進(jìn)展

稿件來源：重點(diǎn)實(shí)驗(yàn)室袁易揚(yáng)、張康瑋發(fā)布時(shí)間：2024-02-26

當(dāng)前，基于邊緣智能計(jì)算設(shè)備運(yùn)行的人工智能應(yīng)用日趨復(fù)雜及高精度，為降低邊緣設(shè)備運(yùn)行的延遲和功耗，存算一體技術(shù)被應(yīng)用在邊緣設(shè)備端，通過減小數(shù)據(jù)搬運(yùn)的開銷最大化減少邊緣設(shè)備上的延遲與功耗。但傳統(tǒng)的存算一體宏僅支持使用整數(shù)型數(shù)據(jù)計(jì)算，難以支持日趨高精度、高復(fù)雜度以及片上訓(xùn)練的邊緣端智能計(jì)算任務(wù)。且僅使用單一模擬或數(shù)字方案的存算一體宏，在能量效率、面積效率和精度上難以取得最優(yōu)化。如何有效結(jié)合模擬存算與數(shù)字存算模式優(yōu)勢，在總體上取得更高的能量效率和面積效率，同時(shí)盡可能保證高精度，以及如何探索數(shù)?；旌戏桨傅脑O(shè)計(jì)空間，仍然是存算一體宏領(lǐng)域繼續(xù)解決的問題。

針對(duì)以上問題，中國科學(xué)院微電子研究所劉明院士團(tuán)隊(duì)研發(fā)出基于外積運(yùn)算的數(shù)模混合存算一體宏芯片，設(shè)計(jì)了一種數(shù)模混合浮點(diǎn) SRAM 存內(nèi)計(jì)算方案，提出了模擬與數(shù)字存算宏的混合方法，結(jié)合了使用模擬存算方案進(jìn)行高效陣列內(nèi)位乘法和使用數(shù)字存算方案進(jìn)行高效陣列外多位移位累加的優(yōu)點(diǎn)，達(dá)到整體上高能量效率與面積效率。通過殘差式數(shù)模轉(zhuǎn)換器架構(gòu)，使數(shù)模轉(zhuǎn)換器所需分辨率僅為輸入位精度的對(duì)數(shù)，實(shí)現(xiàn)了高吞吐率和低開銷。通過基于矩陣外積計(jì)算數(shù)學(xué)原理的浮點(diǎn)/定點(diǎn)存算塊架構(gòu)，矩陣-矩陣-向量計(jì)算可通過累加器元件完成。同之前的數(shù)字存算方案使用矩陣內(nèi)積原理的大扇入、多級(jí)加法器樹相比，吞吐率更高。該架構(gòu)還支持細(xì)粒度的非結(jié)構(gòu)激活稀疏性以進(jìn)一步提升總體能效。該存算一體宏芯片在28nm ?CMOS工藝下流片，可支持BF16浮點(diǎn)精度運(yùn)算以及INT8定點(diǎn)精度運(yùn)算，BF16浮點(diǎn)矩陣-矩陣-向量計(jì)算峰值能效達(dá)到了72.12TFLOP/W，INT8定點(diǎn)矩陣-矩陣-向量計(jì)算峰值能效達(dá)到了111.17TFLOP/W。這一研究結(jié)果為采用數(shù)?；旌戏桨傅拇嫠阋惑w架構(gòu)芯片提供了新思路。

近期，本工作以“A 28nm 72.12TFLOPS/W Hybrid-Domain Outer-Product Based Floating-Point SRAM Computing-in-Memory Macro with Logarithm Bit-Width Residual ADC”為題發(fā)表在 ISSCC 2024國際會(huì)議上，微電子所博士生袁易揚(yáng)為第一作者，張鋒研究員與北京理工大學(xué)王興華教授為通訊作者。該研究得到了科技部重點(diǎn)研發(fā)計(jì)劃、國家自然科學(xué)基金、中國科學(xué)院戰(zhàn)略先導(dǎo)專項(xiàng)等項(xiàng)目的支持。

28nm 基于外積的數(shù)?；旌细↑c(diǎn)存算一體宏芯片：（a）芯片顯微鏡照片，（b）芯片特性總結(jié)表

附件：

中國科學(xué)院微電子研究所版權(quán)所有郵編：100029
單位地址：北京市朝陽區(qū)北土城西路3號(hào)，電子郵件：webadmin@ime.ac.cn
京公網(wǎng)安備110402500036號(hào)，京ICP備05002781號(hào)-1

最新精品国偷自产在线美女足_国产午夜精华无码网站_天天爱天天做狠狠久久做_国产片免费福利片永久_欧美国产成人精品一区二区三区

綜合信息

綜合新聞

微電子所在數(shù)?；旌洗嫠阋惑w芯片方面取得重要進(jìn)展

附件：