显卡30系列深度解析(上篇)

更新:10-27 神话故事 我要投稿 纠错 投诉

大家好,显卡30系列深度解析(上篇)相信很多的网友都不是很明白,包括也是一样,不过没有关系,接下来就来为大家分享关于显卡30系列深度解析(上篇)和的一些知识点,大家可以关注收藏,免得下次来找不到哦,下面我们开始吧!

学号:20021210601 姓名:魏素恒

【嵌入式牛介绍】NVIDIA新一代30系列显卡简析。

【嵌入式牛鼻子】RTX3070 RTX3080 RTX3090

【嵌入牛文】

在当前的显卡市场上,占据80%份额的NVIDIA让玩家们又爱又恨。他们带来了近十年来最好的显卡,也让高端游戏卡的价格不断上涨。现在RTX 3090 起价为五位数。

RTX 30系列显卡发布后,玩家的不满似乎得到了缓解。与目前的图灵显卡相比,基于Ampere的RTX

3090/3080/3070显卡突然变得非常受欢迎,因为它们不仅性能翻倍,而且国内价格居然下降了。

·GeForce RTX 3090:取代RTX Titan,与Titan相比

RTX 速度提升50%,性能是RTX 2080 Ti 显卡的两倍。配备24GB GDDR6X显存,售价11999元,9月24日上市。

·GeForce RTX 3080:取代RTX 2080 Ti,与RTX相比

2080的性能提升2倍,配备10GB GDDR6X显存。海外699美元价格没有变化,但国内价格从上一代的6499元降至5499元。将于9月17日上线。

GeForce RTX 3070:价格不到RTX 2080 Ti 的一半,但平均性能更高,比RTX 2070 快整整60%,配备8GB

GDDR6显存售价3899元,将于10月份上市。

RTX30系列显卡价格及上市时间

RTX30系列显卡性能变化

RTX

30系列显卡规格

从这张规格表中可以看出,与RTX 2080 Ti显卡相比,RTX 3090标志性的FP32性能从13.4T提升到35.7T,增加了一倍多,并且在光追和AI加速方面的提升也很明显。

与Turing显卡相比,Ampere GPU的变化令人惊讶。在过去十年的显卡升级中,性能翻倍的情况并不多见。英伟达是如何做到的?

今天我们就来详细讲解Ampere GPU的架构,探究它带来了哪些被NVIDIA创始人黄仁勋称为史上最大的性能提升的技术升级。

先从工艺说起:12nm秒杀7nm后,8nm如何进一步发展?

对于半导体芯片来说,关键的一环就是工艺技术。先进的架构也必须通过技术来实现。这是影响芯片能效、性能甚至成本的主要因素。

对于NVIDIA来说,他们的Volta和Turing架构都是基于台积电的12nm FFN工艺,这是台积电16nm工艺的改进版本。如果算上16nm Pascal架构的话,其实过去三代GPU并没有产生什么明显的影响。该流程已升级。

在Ampere架构上,NVIDIA终于升级了工艺,不过这次有两个惊喜。首先,——没有选择台积电,其次,它没有选择7nm,而是三星定制的8nm工艺。虽然看起来和7nm只有1nm的差别,但实际上是两代工艺。

考虑到NVIDIA此前在技术上的立场,预计将采用三星的8nm工艺,而不是7nm工艺。最关键的问题是NVIDIA 能做得如何。

三星的8nm工艺是在10nm工艺基础上的改进。至少有两个版本:LPP 和LPU。前者适用于移动SoC,后者适用于高性能芯片。 NVIDIA的定制很可能是基于后者。

与台积电7nm工艺晶体管密度约1亿个/mm2相比,8nm工艺约6000万个晶体管/mm2,但这是单个SRAM芯片的比较。事实上,GPU芯片更复杂,差距会小很多。

根据NVIDIA公布的信息,台积电7nm工艺制造的Ampere A100核心拥有540亿个晶体管,核心面积为826mm2,而三星8nm工艺制造的GA102核心拥有280亿个晶体管。核心区尚未正式公布。据悉,其尺寸为628mm2,同样是大芯。

以此计算,7nm A100核心的晶体管密度为6560万个晶体管/mm2,而三星的8nm GA102核心也有4460万个晶体管/mm2。差距仍然存在,但似乎可以接受。

三星8nm工艺的晶圆代工价格目前仍是一个秘密,但从技术和商业策略来看,三星会比台积电便宜很多。预计代工价差将达到30%甚至更高,所以这也是RTX 30系列显卡无法涨价的原因。甚至是降价的关键。

那么三星8nm工艺带来了多大的性能和能效提升呢?首先可以看到RTX 30系列显卡的频率有所提升,从RTX 20系列的1.5GHz+提升到了1.7GHz+。升级后的工艺提高了性能。

不过RTX 20系列的加速频率实际上可以达到1.9GHz甚至接近2GHz,而RTX 30系列预计也会达到这个水平。

然而,能源效率得到了提高。 NVIDIA官方宣称,在60fps性能下,图灵显卡的功耗约为240W,安培显卡的功耗则在120W以上。算下来,是能源效率的1.9倍,提升了90%,而且温度也更低。 3度,噪音降低2分贝。

总体来说,在工艺方面,大家对于Ampere GPU是既惊讶又失望。令人失望的是,它没有预期的7nm工艺(无论台积电还是三星),工艺仍然升级到8nm。

不过,NVIDIA的工艺虽然不算激进,但性能和能效却有了很大的提升。安培显卡各方面都明显优于现在的图灵卡,而且价格不升反降。这也不是追求激进的技术。优点是12nm无论如何都能赢,但现在上8nm更有把握。

Ampere GPU架构详解:FP32单元加倍CUDA核心,有什么变化?

Ampere发布时,NVIDIA首席执行官黄仁勋表示,这是GPU历史上最大的性能飞跃。 2018年图灵GPU推出时,黄仁勋也同样表示,—— GPU是史上最大的改变。这两个评价其实都是正确的。

图灵GPU架构有很多第一。首次支持RTX Core(光追加速单元),首次支持Tensor Core,还改进了CUDA内核,但前两者才是重点。

在Ampere GPU、RT Core、Tensor 上

当然,Core还在继续加强,但主要亮点还是CUDA架构的改进。性能倍增的根源就在这里。我们先来看看这方面的变化。

GA102核心架构图

GA102核心共有7组GPC单元,每组有12组SM单元,总共84组。 RTX 30系列显卡中启用的SM单元总数取决于不同的规格。 RTX 3090有82组,RTX 3080有68组,RTX 30系列显卡有82组。

3070是46组。

在之前的GA100核心中,每组SM由64个INT32单元、64个FP32单元和32个FP64单元组成。不过在GA102核心中,FP64单元大幅减少,增加了RT Core,Tensor Core也略有减少。

GA102核心SM单元

沿袭了之前的Turing GPU路线,Ampere GPU的SM单元并没有增加太多,但实际上FP32性能却提升了一倍多。算上频率,RTX 3080的理论性能几乎是RTX 2080的三倍。这是怎么做到的呢?

答案是把CUDA核心的FP32加倍,但是加倍的方法有点特殊。每个SM单元有4个分区,除了第三代Tensor之外的每个分区

除了Core核心之外,还有一组16个FP32单元、16个FP32单元、16个IN32单元。后者可以同时执行FP32 或INT32 操作。

16个FP32单元每个周期可以执行16个FP32操作,混合单元可以执行32个FP32或16个FP32+16个INT32。

这样,每个SM单元可以同时执行4x(16FP32+16FP32)=128 FP32操作,或者4x(16FP32+16INT32)=64 FP32 + 64 INT32操作。

如果只算FP32浮点数的话,那么浮点数就翻倍了,因为Turing和GA100每个周期只有64个FP32浮点数,现在可以做128个FP32运算。

提高FP32 性能对于游戏和计算都有很大好处,但也需要配套的改进。 GA102的L1容量提升了33%,L1带宽翻倍,从116GB/s提升到219GB/s,共享内存性能也从116GB/s提升到219GB/s。 64B 翻倍为128B。

Ampere GPU架构详解:RTX光线追踪从可用到易用升级

上一代图灵GPU架构的最大亮点就是RTX实时光线追踪技术的引入,开启了3D游戏的光线追踪时代,意义重大。

不过,做先锋的代价也不小,图灵GPU的光线追踪效果在实际游戏中并不明显,对性能影响很大。第一代RTX 光线追踪只能说是解决了问题,而目前的Ampere GPU 更有用的是RTX 光线追踪。

在Turing GPU 上,NVIDIA 使用的第一代RT

Core可以提供10Giga Rays/s的性能,并且在Ampere GPU上,RT Core已经升级到第二代,号称性能提升一倍。仅此一点就可以极大地提高光追踪性能。

图灵GPU光追架构

Ampere GPU 光追踪

但这还不够。在Ampere GPU上,参与光追应用加速的不仅仅是SM单元和RT单元。第三代Tensor Core单元也参与更多。 Ampere架构中的SM、RT、Tensor单元的性能均得到了大幅提升。以RTX 3080为例,SM单元性能从11T提升到30T,RT性能从上一代34T提升到58T,Tensor性能从89暴涨到238T。

这样做的结果之一是光追踪性能得到了极大的提高。不支持硬件加速的Pascal GPU 渲染一帧需要51 毫秒。图灵可以将其增加到19ms。通过DLSS,可以缩短到13ms,这已经比60fps的要求低很多了。 16.6 毫秒帧时间。

在Ampere GPU 上,时间甚至可以更快。仅硬件加速即可从13ms缩短至7.5ms。加上第二代技术后,仅为6.7ms。

总之,就RT光追性能而言,别说没有硬件加速的Pascal显卡,相比RTX 2080到RTX 3080的变化,软件渲染的性能提升了40%,有硬件加速的情况下提升了70%,硬件加速+DLSS也得到了提升。 70%,加上其他技术的辅助,光追性能最高可提升90%。

显卡30系列深度解析(上篇)和的问题分享结束啦,以上的文章解决了您的问题吗?欢迎您下次再来哦!

用户评论

纯情小火鸡

最近想升级显卡,感觉30系列蛮火的

    有11位网友表示赞同!

拥抱

30系一直是我的心头好,性能强悍啊!

    有9位网友表示赞同!

古巷青灯

等不及想知道哪个型号更适合我呢

    有17位网友表示赞同!

颜洛殇

看标题应该是针对玩游戏的吧,30系对游戏体验影响很大啊。

    有8位网友表示赞同!

从此我爱的人都像你

希望这篇文章能简单直白的讲解一下每个型号的特点

    有18位网友表示赞同!

煮酒

之前一直没弄清楚30系的命名规则,希望这篇分析能搞懂。

    有9位网友表示赞同!

▼遗忘那段似水年华

学习一下30系显卡的优缺点,以便下决策呢!

    有13位网友表示赞同!

容纳我ii

文章能否对比一下不同型号的性能提升?

    有15位网友表示赞同!

厌归人

对新手入门的朋友来说,一篇浅析正好合适!

    有17位网友表示赞同!

来瓶年的冰泉

期待看到30系的最新动态和分析!

    有5位网友表示赞同!

孤廖

看标题感觉这个“前”应该是分两批写吧?后半部分也值得期待!

    有16位网友表示赞同!

余温散尽ぺ

希望这篇文章能涵盖30系的主要型号,方便我比较选择!

    有9位网友表示赞同!

无寒

我的电脑配置有点老了,wondering if 30 series would be a big upgrade ?

    有8位网友表示赞同!

妄灸

想了解一下30系显卡的性价比怎么样?

    有12位网友表示赞同!

心安i

文章能不能简单介绍一下30系的功耗和散热情况呢?

    有17位网友表示赞同!

猫腻

我的预算有限,不知道可以选择哪些型号。希望这篇文章能给我一些建议!

    有15位网友表示赞同!

枫无痕

最近听说30系显卡的驱动比较稳定了?是真的吗?

    有12位网友表示赞同!

揉乱头发

除了游戏性能,30系显卡还能用于什么场景呢?

    有14位网友表示赞同!

ヅ她的身影若隐若现

对于专业用途来说,30系显卡怎么样?

    有6位网友表示赞同!

咆哮

期待看到这篇对30系显卡的详细浅析!

    有14位网友表示赞同!

【显卡30系列深度解析(上篇)】相关文章:

1.蛤蟆讨媳妇【哈尼族民间故事】

2.米颠拜石

3.王羲之临池学书

4.清代敢于创新的“浓墨宰相”——刘墉

5.“巧取豪夺”的由来--米芾逸事

6.荒唐洁癖 惜砚如身(米芾逸事)

7.拜石为兄--米芾逸事

8.郑板桥轶事十则

9.王献之被公主抢亲后的悲惨人生

10.史上真实张三丰:在棺材中竟神奇复活

上一篇:《金刚经》独特解读(上篇) 下一篇:揭秘天猫返利:十大热门高佣返利APP推荐,返利哪家强?