首頁 > 要聞 > 正文

開拓領(lǐng)域?qū)S糜嬎慵軜?gòu),「中科馭數(shù)」為應(yīng)用層計算釋放更多算力資源

2021-12-09 11:11:07來源:創(chuàng)業(yè)邦  

在英偉達GTC年度大會上,英偉達(NVIDIA)發(fā)布了全新處理器 DPU(Data Processing Unit,數(shù)據(jù)處理單元),并將其定位為數(shù)據(jù)中心中繼CPU、GPU之后的“第三顆主力芯片”,正式將DPU這一概念推向時代潮頭。

放眼國內(nèi)各家DPU芯片研發(fā)廠商,中科馭數(shù)(北京)科技有限公司(以下簡稱:中科馭數(shù))率先于2019年流片了業(yè)內(nèi)首顆數(shù)據(jù)庫和時序數(shù)據(jù)處理融合加速芯片“DPU-K1”,現(xiàn)已為華泰證券、中泰證券、上交所等頭部證券企業(yè)輸出成熟的產(chǎn)品及硬件加速解決方案。

此外,創(chuàng)業(yè)邦還獲悉,中科馭數(shù)將在2022年面向市場推出性能強化、帶寬及協(xié)議格式更加豐富的“DPU-K2”芯片。

01

隨著摩爾定律放緩,通用CPU性能增長的成本迅速上升,但整個網(wǎng)絡(luò)帶寬的增長卻不斷加速,這在國內(nèi)金融、云計算、數(shù)據(jù)中心等場景下尤為常見。

這些場景下的網(wǎng)絡(luò)帶寬正在從主流的10G朝著40G、100G甚至400G發(fā)展,帶寬和節(jié)點的劇增使得數(shù)據(jù)的通路更寬、更密,處于端、邊、云各處的計算節(jié)點直接暴露在了劇增的數(shù)據(jù)量下,使得CPU的性能增長率與數(shù)據(jù)量增長率出現(xiàn)了明顯的“剪刀差”現(xiàn)象,CPU難以直接應(yīng)對龐大數(shù)據(jù)計算負載。

DPU作為給CPU“減負”的幫手,主要作用在于卸載CPU部分算力并釋放到上層應(yīng)用中,支持存儲、安全、服務(wù)質(zhì)量管理等基礎(chǔ)設(shè)施層服務(wù),幫助使用者獲得超高性價比的算力,有效克服通信延遲,提升數(shù)據(jù)安全水平。

據(jù)《中國數(shù)據(jù)處理器行業(yè)概覽系列短報告》數(shù)據(jù)研究預(yù)測,僅在DPU應(yīng)用需求最大的云計算領(lǐng)域,2025年中國DPU市場的容量有望達40億美元,而當前DPU應(yīng)用較為廣泛的金融、電信領(lǐng)域更有望在短期內(nèi)支撐起一個百億規(guī)模的市場,規(guī)模十分可觀。

02

中科馭數(shù)成立于2018年,孵化于中科院計算所計算機體系結(jié)構(gòu)國家重點實驗室,是一家專注于專用計算架構(gòu)研發(fā)的硬科技企業(yè),致力于解決后摩爾定律時代通用算力不足的核心問題,為智能計算提供DPU芯片和解決方案。

在創(chuàng)立之初,中科馭數(shù)便提出了“軟件定義加速器”的技術(shù)路線,并研發(fā)專用技術(shù)芯片架構(gòu)——KPU(Kernel Processing Unit,核處理器)。

這是一種專為加速特定領(lǐng)域核心功能計算而設(shè)計的一種協(xié)處理器架構(gòu),以功能核作為基本單元,具備超強異構(gòu)核集成和調(diào)度能力。

一顆KPU根據(jù)需求可以集成數(shù)十至數(shù)百個功能核,可直接對應(yīng)用中的計算密集型應(yīng)用進行抽象核和高層綜合,實現(xiàn)以數(shù)據(jù)為中心的架構(gòu)“定制”,靈活性極高,在保障充沛算力的同時以最低功耗支撐更多運算負載類型。

據(jù)中科馭數(shù)創(chuàng)始人&CEO鄢貴海介紹,在運行機制上,KPU采用“數(shù)據(jù)驅(qū)動并行計算”的方式,通過運行過程中的數(shù)據(jù)流來激活不同的功能核進行相應(yīng)計算。另外,“軟件定義”的方式也可讓用戶靈活建立“功能核”與應(yīng)用層運算間的關(guān)系,滿足“一對一”服務(wù)需求,保證計算效率。

基于這一專用技術(shù)芯片架構(gòu),中科馭數(shù)推出DPU芯片產(chǎn)品——DPU-K1。該產(chǎn)品在業(yè)內(nèi)率先支持網(wǎng)絡(luò)數(shù)據(jù)庫一體化加速功能,除傳統(tǒng)的網(wǎng)絡(luò)協(xié)議處理及相關(guān)應(yīng)用卸載,DPU-K1還涉及芯片級別的運算功能,用于承載數(shù)據(jù)庫及大數(shù)據(jù)處理中的核心運算負載,具備高效能算力。

中科馭數(shù)DPU芯片實物圖

這一芯片主要是針對序列數(shù)據(jù)處理及大數(shù)據(jù)分析而設(shè)計,集成了序列卷積tscov、序列濾波tsfir、序列距離tsdist、序列相似tsdtw等20多類功能核,在超低延時智能網(wǎng)卡、大數(shù)據(jù)處理、風控等應(yīng)用領(lǐng)域,可較傳統(tǒng)軟件解決方案實現(xiàn)超兩個數(shù)量級的性能提升,與DPU-K1擁有相同功能的FPGA版本芯片現(xiàn)已實現(xiàn)量產(chǎn)出貨。

除此之外,中科馭數(shù)還增加了大數(shù)據(jù)處理引擎和查詢加速引擎,這也是現(xiàn)在DPU廠商比較關(guān)鍵的技術(shù)點,且包含部分定制化加速單元,基本構(gòu)建起來整個DPU的框架,在此基礎(chǔ)上中科馭數(shù)繼續(xù)做加法和整合、不斷迭代,也為DPU-K2系統(tǒng)的設(shè)計奠定了基礎(chǔ)。

03

目前,市面上做DPU研發(fā)的除了芯片公司,還有互聯(lián)網(wǎng)巨頭入局,如AWS的Nitro,阿里云的MOC卡等。出于匹配自身上層負載需求,互聯(lián)網(wǎng)巨頭的“造芯”往往具有一定的封閉性,有的重視存儲卸載,有的強化IO能力,還有的關(guān)注路由轉(zhuǎn)發(fā),對這部分“造芯”勢力而言,DPU的標準化道阻且長。

中科馭數(shù)將自身定位于一家芯片設(shè)計公司,致力于研發(fā)泛行業(yè)的DPU產(chǎn)品,從設(shè)計階段就盡可能地標準化,嘗試對接開放系統(tǒng),實現(xiàn)更廣泛的網(wǎng)絡(luò)協(xié)議加速和查詢加速,而非適應(yīng)單一的內(nèi)部封閉系統(tǒng)需求。這在中科馭數(shù)第二代芯片產(chǎn)品DPU-K2上得到了很好的體現(xiàn)。

DPU-K2芯片較上代產(chǎn)品得到多重強化,以異構(gòu)眾核為基礎(chǔ)實現(xiàn)了以數(shù)據(jù)為中心的高性能DPU架構(gòu)。該芯片在數(shù)據(jù)平面集成了四類KPU處理引擎,以數(shù)據(jù)為中心,集成自研FlashNOC?流式片上互聯(lián)架構(gòu),可實現(xiàn)數(shù)百個處理核互聯(lián),在2TB/S數(shù)據(jù)帶寬下保證零阻塞數(shù)據(jù)傳輸。

在控制平面,該芯片集成了多核ARM Cortex-A72通用處理器核,為用戶提供以Linux操作系統(tǒng)為基礎(chǔ)良好編程性的開發(fā)環(huán)境,并搭載馭數(shù)自研LightningDMA?底層驅(qū)動程序,可實現(xiàn)控制平面與數(shù)據(jù)平面超低延時交互。

DPU-K2還搭建了DPU KOS運行時系統(tǒng),對DPU各資源進行動態(tài)監(jiān)控,在控制平面實現(xiàn)了完備的安全控制,以高性能的規(guī)則引擎支持金融、電信、邊緣計算及數(shù)據(jù)中心等場景。該款芯片預(yù)計將于2022年完成流片,并逐步投入測試生產(chǎn)。

04

2021年,中科馭數(shù)還面向市場推出了專用計算敏捷異構(gòu)軟件平臺HADOS,這也是中科馭數(shù)整合行業(yè)需求、支持異構(gòu)計算更多應(yīng)用的前端標準化平臺。

鄢貴海介紹:“DPU-K1在為客戶提供應(yīng)用時并沒有完整的中間件,為了把我們的方案放進去,就要從驅(qū)動開始做SDK,為客戶做軟件的開發(fā)平臺、數(shù)據(jù)庫,最后還要去移植他們上層的應(yīng)用協(xié)議,做風控時還要用數(shù)據(jù)庫的前端GDBC和ODBC,中科馭數(shù)現(xiàn)將這些功能水平整合,并按照不同的層次、客戶的上層應(yīng)用來做分流,推出了HADOS。”

HADOS集成中科馭數(shù)在領(lǐng)域?qū)S糜嬎慵軜?gòu)、專用處理器研發(fā)及相關(guān)產(chǎn)品和應(yīng)用經(jīng)驗,可支撐DPU芯片及其他異構(gòu)計算硬件平臺算力輸出,兼容標準軟件應(yīng)用生態(tài),大幅降低以KPU架構(gòu)和DPU芯片為核心的應(yīng)用軟件開發(fā)難度。

基于HADOS軟件開發(fā)平臺,客戶可以通過自有軟件團隊,快速開發(fā)包括DPU芯片等異構(gòu)算力在軟件定義網(wǎng)絡(luò)、軟件定義存儲、虛擬化IO、安全、大數(shù)據(jù)運算等計算基礎(chǔ)設(shè)施方向上的應(yīng)用,大幅提升系統(tǒng)性能和效率,提升系統(tǒng)易用性,平臺現(xiàn)已配合DPU芯片產(chǎn)品投入使用。

05

商業(yè)模式上,中科馭數(shù)為客戶規(guī)劃DPU產(chǎn)品解決方案,提供硬件產(chǎn)品、軟件配套,并幫助客戶做應(yīng)用導入。公司整體上采用垂直行業(yè)深耕的打法,扎實服務(wù)于金融、證券客戶,并已覆蓋華泰證券、中泰證券等前20大券商。

2021年中科馭數(shù)開始拓展電信及泛金融領(lǐng)域客戶,承擔部分政府項目,B端客戶的平均項目交付周期為9個月左右,2022年有望控制在4個月以內(nèi)。

中科馭數(shù)團隊現(xiàn)有成員百余人,其中研發(fā)人員占比近90%,核心成員來自于中科院計算所體系結(jié)構(gòu)國家重點實驗室,在異構(gòu)計算方面積累深厚。

鄢貴海本人擔任中科院計算所研究員、博士生導師,主要研究專用計算機體系結(jié)構(gòu),在容錯計算、可定制計算、軟件定義加速器等方向取得一系列研究成果。

截至目前,中科馭數(shù)已布局發(fā)明專利130項,其中已獲得66項發(fā)明專利授權(quán),公司還獲得多項軟件著作權(quán)和集成電路布圖產(chǎn)權(quán)保護。

融資方面,中科馭數(shù)現(xiàn)已完成A輪融資,歷史投資方包括華泰創(chuàng)新、國新思創(chuàng)、中科創(chuàng)星和靈均投資,多家股東連續(xù)多輪注資。

接下來,中科馭數(shù)將以金融計算加速作為抓手,面向數(shù)據(jù)中心、電信運營商等客戶類型,不斷推進DPU方案的應(yīng)用落地,并與中科曙光等生態(tài)伙伴合作,在產(chǎn)品適配后進一步拓寬客戶渠道,逐漸幫助更多信創(chuàng)產(chǎn)業(yè)客戶、政府客戶等解決或協(xié)助解決算力難題。

關(guān)鍵詞: 開拓領(lǐng)域?qū)S糜嬎慵軜?gòu) 「中科馭數(shù)」為應(yīng)用層計算釋放更多

責任編輯:hnmd003

相關(guān)閱讀

推薦閱讀