NVIDIA Tesla P100計(jì)算卡性能首測(cè):震撼地球!
GTX 1080/1070雖然性能很強(qiáng)悍,但它們?cè)谌碌呐了箍易逯兄荒芩闶侵袡n水準(zhǔn),真正的大殺器是頂級(jí)大核心GP100,擁有3840個(gè)FP32單精度、1920個(gè)FP64雙精度CUDA核心,主要面向高性能計(jì)算領(lǐng)域。
擔(dān)任首發(fā)的Tesla P100(似乎也叫Tesla P1),只開啟了3584個(gè)單精度、1792個(gè)雙精度核心,即便如此單、雙精度浮點(diǎn)性能也高達(dá)10.6TFlops、5.3TFlops,同時(shí)還搭配了4096-bit 16GB HBM2高帶寬顯存,并支持全新的NVLink互連總線,取代傳統(tǒng)PCI-E。
那么它到底性能如何呢?圣地亞哥超級(jí)計(jì)算中心的Scott Le GrandRoss Walker、亞馬遜網(wǎng)絡(luò)服務(wù)的Scott Le Grand聯(lián)合編寫了一個(gè)通用計(jì)算測(cè)試工具AMBER,可模擬生物分子周圍的力場(chǎng),并與NVIDIA合作對(duì)Tesla P100進(jìn)行了一番測(cè)試,包括單路、雙路、四路。
由于測(cè)試所用硬件還是工程樣品,操作系統(tǒng)是Linux,而且測(cè)試工具和測(cè)試方法是專門為了考察純粹計(jì)算性能而設(shè)計(jì)的,所以結(jié)果反映的只是純計(jì)算能力,和游戲表現(xiàn)無關(guān)。
事實(shí)上,GP100核心應(yīng)該永遠(yuǎn)不會(huì)出現(xiàn)在消費(fèi)級(jí)領(lǐng)域,GTX 1080 Ti、GTX Titan X 2之類的頂級(jí)卡會(huì)使用GP102。
參與對(duì)比的產(chǎn)品中,Tesla M40基于麥克斯韋架構(gòu)大核心GM200,3072個(gè)流處理器,單精度性能突破7TFlops,雙精度只有0.21TFlops,搭配384-bit 12GB GDDR5顯存。
Tesla K80使用的是兩個(gè)開普勒架構(gòu)大核心GK210,4992個(gè)流處理器,單雙精度浮點(diǎn)性能8.74、2.91TFlops,搭配兩組384-bit 12GB GDDR5。
Tesla K40的核心是GK110,2880個(gè)流處理器,單雙精度浮點(diǎn)性能4.29、1.43TFlops,搭配384-bit 12GB GDDR5。
GTX 1080、Titan X、980 Ti、980也都加入了對(duì)比,另外還有幾顆純CPU,包括雙路的E5-2697 v4/2698 v3/2650 v3,分別有32/32/20個(gè)核心。
具體測(cè)試原理、流程啥的就不多說了,專業(yè)性太強(qiáng),只簡(jiǎn)單看看結(jié)果:
相比于前輩M40,P100的計(jì)算性能提升相當(dāng)猛,絕大部分項(xiàng)目都在50%左右,少數(shù)甚至超過80%,有的甚至接近100%!
事實(shí)上在大部分時(shí)候,單路P100都能干掉雙路M40,領(lǐng)先幅度10-20%不等。
對(duì)比消費(fèi)級(jí)游戲卡,P100單路已經(jīng)相當(dāng)于GTX Titan X四路的水準(zhǔn),也可以看到GTX 1080同樣十分兇猛,多數(shù)情況下都達(dá)到或者接近M40的水平,但不夠穩(wěn)定,有時(shí)候相當(dāng)于單塊Titan X,有時(shí)候超過人家兩塊。
最遺憾的是,NV-Link總線的威力還沒有發(fā)揮出來,雙路、四路P100的提升幅度普遍還不如PCI-E。
八路Tesla P100