欢迎来到四川泊祎废旧物资回收有限公司官方网站,全川咨询服务热线:1388-0022-916
您的位置: 首页 > 回收百科 > NVIDIA:Maxwell使用统一寻址,Volta集成堆栈式内存

NVIDIA:Maxwell使用统一寻址,Volta集成堆栈式内存

发布时间:2021-09-17 2:57:26   作者:佚名

在看过了Tegra处理器的路线图之后,我们再来看看GTC2013大会上公布的GPU路线图。在此之前我们只知道2013年依然是Kepler架构,不过核心会从去年的GK104变成现在的GK110,再下一代就是原本预计在2013年发布的Maxwell麦克斯韦尔,现在推到了2014年。NVIDIA现在又给出了Maxwell的继任者——

AlessandroVolta(亚历山德罗·伏特,维基链接),他是一位意大利物理学家,电池的发明者。

现在Volta还只是一个代号,详细的架构信息不得而知,不过NVIDIA此次公布的路线图中给出了每代GPU架构的技术进步,我们可以从中一窥Volta的设计。

Volta的特点是集成了堆栈式内存(StackedDRAM),这意味着DRAM电路与GPU核心非常接近,二者通过TSVs(using

through-siliconvias,硅通孔)技术连接起来。高带宽的板载DRAM设计并非什么新技术,但是这个设计依然非常独特。

以往的一个例子是索尼的PSVita,它的GPU就有128MB的RAM内存,不过并没有使用TSVs设计。Intel的Haswell处理器中新增了GT3级别的核心,还记得以前的新闻吗,GT3核心就具备128MB的嵌入式缓存。

使用堆栈式内存设计的好处不仅在于极大地提高了带宽,而且延迟也会很低,相比外置式内存,它在速度及宽度上都有优势,当然具体如何还要看实际配置。如果内存离GPU核心很近,那么好处不仅是带宽高,而且运行频率也可以很高。

对Volta来说,NVIDIA的目标是为其提供1TB/s的带宽,这个数据是目前带宽最高的GTX

Titan的3倍,后者使用的是384bit位宽,1502MHz的GDDR5显存,带宽也只有288GB/s,那么Volta有可能搭配的是1024bit位宽、速率8Gbps,也有可能是2048bit位宽、4Gbps速率,现在来看实现的难度颇大,不过Volta依然有好几年的时间才能面世,技术进步的速度谁又能说清呢。

更让人感兴趣的是NVIDIA如何解决芯载DRAM的容量问题。目前的DRAM(面积)还是相当大的,特别是GDDR显存,显卡要想完全使用这种设计不太可能,因为目前的消费级显卡的显存容量已经达到了6GB。

NVIDIA更可能的做法是使用分离式DRAM设计,芯片内集成的DRAM主要用作缓存及共享内存的交换池(pool),而外部总线依然会搭配大容量显存,虽然速度会比堆栈式集成的慢一些。

Volta在NVIDIA的路线图时并没有时间表,因此我们不知道它什么时候才能发布。Maxwell原本预计在2013年发布,但是也推迟到明年了,Kepler原本也是在2011年发布的,结果也是在去年才发布。虽然NVIDIA没有说明为什么,但是看起来NVIDIA的产品还是与TSMC的工艺紧密连接在一起,发布新架构时往往需要使用新工艺,Volta的开发需要搭载某个特定的工艺,只不过目前这一切都是未知数。

TSMC还在努力追赶制程工艺最先进的Intel,不过很难预计未来会发生什么,所以(Volta)缺少时间表一点也不奇怪。NVIDIA在演讲中提到了他们会在未来的Parker

SoC(Logan之后的Tegra处理器,蜘蛛侠名字)处理器上使用FinFET(鳍式晶体管,也就是3D晶体管)工艺,但是没有提到Volta也会使用FinFET工艺,因此具体如何还真不好说。

NVIDIA也给出了有关VoltaGPU性能的粗略估计,以单位瓦特的FP64双精度性能为例,K20X大约是5.5GFLOPS/W,Volta大约是24ish,由于NVIDIA还要考虑功耗因素,因此同等TDP下我们可以认为Volta的性能是K20X的四倍左右,其FP64双精度性能大约在5TFLOPS左右。当然,现在的估计只是一个早期预测,Volta离问世还有段距离。

最后,Volta作为最新披露的GPU架构成功吸引住了媒体的眼光,以致于很多人都忽略了Maxwell的存在。Maxwell的设计要点其实也值得一看,它将是NVIDIA第一个使用“统一虚拟寻址(unified

virtualaddress)”技术的GPU架构,这种设计对同时集成CPU和GPU的设备也非常重要,AMD的HSA异构计算要解决的一个问题就是统一寻址问题。

还有ParkerSoC处理器的问题,这是Logan(Tegra5)之后的处理器代号,它将使用Maxwell架构,CPU架构则是Denver,NVIDIA的Project

Denver就是为GPU开发基于ARM指令的CPU核心,意味着Parker及类似的处理器已经可以集成NVIDIA自己的CPU核心了。


下一篇:   上一篇:

成功案例