5月23日,業(yè)內(nèi)首款存算一體大算力AI元器件在南京后摩智能公司成功點亮,并成功跑通智能駕駛算法模型。該器件基于架構(gòu)創(chuàng)新,采用SRAM(靜態(tài)隨機存取存儲器)作為存算一體介質(zhì),通過存儲單元和計算單元的深度融合,實現(xiàn)了高性能和低功耗,樣片算力達20TOPS,可擴展至200TOPS,計算單元能效比高達20TOPS/W。與傳統(tǒng)架構(gòu)下的大算力器件相比,它在算力、能效比等方面都具有顯著的優(yōu)勢。
在智能駕駛等計算場景中,除了對算力需求高外,對器件的功耗和散熱也有很高的要求。目前,常規(guī)架構(gòu)器件設(shè)計中,內(nèi)存系統(tǒng)的性能提升速度大幅落后于處理器的性能提升速度,有限的內(nèi)存帶寬無法保證數(shù)據(jù)高速傳輸,無法滿足高級別智能駕駛的計算需求。其次,數(shù)據(jù)來回傳輸又會產(chǎn)生巨大的功耗。
為此,后摩智能通過走差異化創(chuàng)新之路,在國內(nèi)率先通過底層架構(gòu)創(chuàng)新,進行大算力AI器件設(shè)計。研發(fā)人員根據(jù)傳統(tǒng)存儲器件重新設(shè)計電路、單元陣列、工具鏈等,同時突破了多項物理和結(jié)構(gòu)上的技術(shù)難題。
據(jù)悉,該款器件采用22納米成熟工藝制程,在提升能效比的同時,還能有效把控制造成本。同時,首次在存內(nèi)計算架構(gòu)上跑通了智能駕駛場景下多場景、多任務(wù)算法模型,為高級別智能駕駛提供了一條全新的技術(shù)路徑。未來有可能用W級別的功耗提供P級別的計算能力,更好地滿足高級別智能駕駛時代的需求。此外,在靈活性方面,它不但支持市面上的主流算法,還可以支持不同客戶定制,更加適配于算法的高速迭代。
關(guān)鍵詞: 高性能低功耗 智能駕駛存算一體器件研發(fā)成功 內(nèi)存帶寬 大算力AI器件設(shè)計