国产精品99无码一区二区,亚洲国产精品无码久久90,欧美黑人性A,免费无码黄片在线看

工作動(dòng)態(tài)

我中心在高效3D卷積算法上取得進(jìn)展

2024-08-27 17:51 | 放大 縮小 |

高性能計(jì)算和人工智能的新興發(fā)展顯著擴(kuò)展了三維卷積神經(jīng)網(wǎng)絡(luò)(3D CNN)的應(yīng)用。然而在實(shí)際的需求應(yīng)用中,復(fù)雜的3D卷積計(jì)算是影響性能的主要因素。

近日,中心高性能計(jì)算部科研人員基于新一代SW26010Pro處理器提出了一種高效的3D卷積算法。新一代神威(Sumway)超級計(jì)算機(jī)在HPC+AI領(lǐng)域表現(xiàn)出卓越的計(jì)算能力,該工作依托Sunway平臺對三維卷積算子進(jìn)行了詳細(xì)的分析與優(yōu)化,針對SW26010Pro架構(gòu)的設(shè)計(jì)了三級分塊算法(圖1),并進(jìn)行了訪存優(yōu)化,同時(shí)提出了一種新穎的散點(diǎn)通信策略(圖2),充分利用片上網(wǎng)絡(luò)帶寬。實(shí)驗(yàn)結(jié)果表明,與基于xMath2.0庫的Sgemm實(shí)現(xiàn)方法相比,我們的三維卷積算法實(shí)現(xiàn)了平均2.54x的加速比,并且實(shí)現(xiàn)了高達(dá)2.12 Tflop/s的單精度浮點(diǎn)性能,達(dá)到理論峰值性能的92%

?3D卷積三級分塊算法

?RMA散點(diǎn)通信策略

該研究成果已被International Conference on Parallel ProcessingICPPCCF B會(huì)議錄用并發(fā)表,論文第一作者為我中心高性能部博士研究生李佳霖,通訊作者為我中心高性能計(jì)算部張鑒研究員。該成果得到中國科學(xué)院先導(dǎo)專項(xiàng)(XDB0500101)的支持。

相關(guān)成果:

Li J, Feng Z, Gao Y, et al. High-Performance 3D convolution on the Latest Generation Sunway Processor[C]//Proceedings of the 53rd International Conference on Parallel Processing. 2024: 241-251.

責(zé)任編輯:郎楊琴

附件下載
一级a一级a爰片免费免免在线| 一本亚洲视屏| 日韩欧美第一区二区三区| aⅴ色国产欧美| 亚洲日韩Av中文字幕无码久久| 天天操天天射男人av| 无码国产精品一区二区vr| 欧美激情乱人伦一区| 色悠悠88| 亚洲午夜成人国产福利| 大尺度AV天堂热国产| 暴力调教一区| 亚洲大桥未久AV高清在线观看| 国产成人综合久久综合| 日韩欧美亚洲中文字幕第二页| 亚州一区二区三区无码久久| 狠狠亚洲婷婷综合色香五月| 国产精品亚洲精品第—区| 国产日韩欧美美女操骚大逼| 色哟哟入口国产精品| 欧美老妇精品一级高潮| 日 韩 色 导航| 人妻少妇精品无码专区漫画| 密桃色导航| 亚洲福利午夜福利无码| 久久精品国产96| 国产欧美日本| 在线视频亚洲专区| 日韩欧美中文字幕制服| 高h文国产免费观看| 日本丰满少妇一区二区三区| 2021亚洲精品无码在| 国产成人AV无码久久久一区| 韩国三级成人不卡在线观看| 超碰cao网站| 国产视频亚洲视频| 97人妻精品无码二区| 蜜桃视频入口黑料| 高潮胡言乱语对白刺激国产| 99久久精品免费看国产电影 | 久久久久无码一区人妻|