在日本的GPU技術(shù)大會(huì)(GTC)上,Nvidia推出了一款用于推理工作負(fù)載的新計(jì)算卡--Tesla T4。

該卡擁有320個(gè)Tensor核心和2560各CUDA核心,功耗低至75W,而FP16半精度峰值性能為65 TFLOPS,INT8為130 TFLOPS,INT4為260 TFLOPS。除了該Tesla計(jì)算卡外,英偉達(dá)還宣布推出面向數(shù)據(jù)中心的Nvidia TensorRT超大規(guī)模推理計(jì)算平臺(tái),該平臺(tái)使用T4 GPU進(jìn)行實(shí)時(shí)推理。

英偉達(dá)加速業(yè)務(wù)副總裁兼通用汽車(GM)伊恩?巴克(Ian Buck)表示:“我們的客戶正朝著人工智能能夠觸及和改善每一種產(chǎn)品和服務(wù)的未來(lái)飛奔。”英偉達(dá)TensorRT Hyperscale平臺(tái)的建立是為了實(shí)現(xiàn)這一目標(biāo),比以前的產(chǎn)品更快速、更高效。
微軟Bing和AI產(chǎn)品副總裁Jordi Ribas補(bǔ)充道:“在實(shí)時(shí)推理工作負(fù)載中使用Nvidia gpu改進(jìn)了Bing的高級(jí)搜索功能,使我們能夠減少圖像的對(duì)象檢測(cè)延遲。我們期待與英偉達(dá)的下一代推理硬件和軟件合作,擴(kuò)大人們從人工智能產(chǎn)品和服務(wù)中獲益的方式。
谷歌云的產(chǎn)品經(jīng)理Chris Kleban也表示,公司“很高興能很快在谷歌云平臺(tái)上支持英偉達(dá)的Turing Tesla T4計(jì)算卡”。服務(wù)器制造商包括思科,戴爾EMC,富士通,HPE,IBM,甲骨文和Supermicro也計(jì)劃發(fā)布帶有T4的GPU服務(wù)器。

關(guān)于GTC的其他消息
本次東京GTC,Nvidia也參與了一些與自動(dòng)駕駛汽車相關(guān)的計(jì)劃。有消息稱,日本電報(bào)電話集團(tuán)計(jì)劃將基于Tensor Core GPU的Nvidia AI平臺(tái)作為其全公司“corevo”AI計(jì)劃的通用平臺(tái),F(xiàn)ujifilm將使用DGX-2系統(tǒng)進(jìn)行AI研究。

川公網(wǎng)安備 51010702001250號(hào)