J9九游会 九游会J9J9九游会 九游会J9从英伟达GeForce GTX 10系开始,历经RTX 20系、RTX 30系……尾号为60的显卡,比如RTX 2060/S、RTX 3060/Ti一直被誉为该系的“甜点卡”。意思是性价比很高,是玩家们眼中的香饽饽。
究其原因,无外乎两点。一是这个档次的显卡,性能刚好能满足玩家在1080P分辨率下,游戏开全高画质的需要(根据Steam最新的硬件调查,5款最受欢迎的GPU中,有4款是60级别的,77%的玩家在1080P或更低的分辨率下游戏)。
第二个原因是60级别的显卡溢价不高,首发价通常在3000元以内,比它更好的70级、80级甚至90级显卡,虽然性能相应提升,但是价格通常是2倍、3倍甚至5倍溢价。所以如果用游戏帧率除以价格,得到的结果毫无疑问60级别是最高的。
去年10月,英伟达率先发布了Ada Lovelace架构的旗舰GeForce RTX 4090显卡,全新的SM计算单元、第三代RT-Core光线追踪核心、第四代Tensor-Core张量核心(AI加速)、超大L2级缓存、以及着色器执行重排序(SER)、DLSS 3等令人眼花缭乱的技术,都彰显着Ada Lovelace架构GPU的强大之处。
随后RTX 4080、4070的发布波澜不惊,反响平平。毕竟价格摆在那里,加上今年全球经济不景气、消费力下滑,大家都更看重花更少的钱,办更多的事。因此5月23日发布的这张RTX 4060 Ti,无疑是整个40系产品中,非常引人关注的一款产品。
然而,RTX 4060 Ti的规格刚泄露便引起了争议,原因在于这张卡使用了128bit显存位宽,而它的前代产品RTX 3060 Ti是256bit。这还没完,4060 Ti的CUDA核心,也就是GPU中最主要的计算单元,也比3060 Ti要少。还有,4060Ti竟然只支持PCIe 4.0 x8接口,而正常显卡接口是PCIe 4.0 x16,又被砍了一半。
仅从参数来看,4060Ti都是一款被“”的产品,部分规格不升反降。那为何会这样?英伟达给出了这样的解释:“Ada Lovelace GPU架构采用全新SM设计,其运行时钟频率大幅提高,并且RTX 4060 Ti的存储子系统支持32MB L2缓存和8GB或16GB超高速GDDR6显存。L2缓存能降低对GPU显存交互的需求,从而提高性能和能效比。”
这句话可以理解为:因为Ada架构的SM单元设计与Ampere架构(RTX 30系)不同,运行频率也更高,因此即便整体数量有所减少,真实计算能力依旧是提升的;此外,Ada架构的存储子系统也和RTX 30系不同,其数据交换效率是由L2缓存和显存共同作用的,L2缓存大幅度增加的情况下,就不再需要那么多的显存带宽。
众所周知,GPU内核是所有计算发生的地方。在上面两张图中,左边绿色的阵列代表着GPU内核中一个个小的SM计算单元,每个SM都有一个超低延迟的L1数据缓存,紧挨其处理内核,使L1成为GPU寻找信息的首选。然而,由于L1缓存需要离内核非常近,它不可能非常大。
如果在L1缓存中找不到内核计算所需的数据,GPU将在L2数据缓存中寻找。L2缓存位于GPU芯片上(与GPU内核集成在一起),并通过一个非常高速的横梁系统连接到所有的GPC(图形处理集群),每个GPC包括多个SM。如果在L2缓存中找到了信息(被称作缓存命中,用H表示),那么我们就挑出这些数据并将其放入内核。
如果在L2缓存中九游会J9 J9九游会找不到信息(被称为缓存缺失,用M表示),那么GPU将需要通过显存接口去到VRAM(显存)里面寻找。这将产生额外的工作量,降低了性能和功耗效率。要知道显存的读取效率是远低于L2缓存的,慢上几十上百倍不止。
所以在上面两张图中,前代GPU架构因为L2缓存较小,缓存缺失(M)较多,那这些缺失的数据就需要去到显存中找,增加了显存访问(V)的次数。而Ada架构下,L2缓存容量增加了16倍之多,大幅度提升了缓存命中率(H),M减少了,自然就不需要频繁访问显存,也就不需要那么高的显存带宽了。
换句话说,因为新架构的出现,以及新的制程工艺的进步,英伟达可以集成更多的晶体管在芯片里面,这令超大L2缓存成为可能。而更大的L2缓存不仅效率更高,同时更省电(减少了显存系统的负担),这是一个更优解。
抛开显存位宽问题不谈,4060 Ti依旧保留了Ada Lovelace架构几乎全部的重要特性。
例如采用英伟达定制台积电4N工艺,结合全新设计的SM流处理器单元,可提供2倍于前代产品的能效比。
配备第3代RT Cores光追核心,支持着色器执行重排序(SER),能提供高达2倍的光追性能。
AV1 Encoders:提供支持AV1的第8代NVIDIA编码器,效率比H.264高40%,为主播、直播用户与视频会议应用带来更高效、更高质量的体验。
此外,能效比方面也是4060 Ti的一大亮点,它的平均游戏功率仅有140W,远低于3060 Ti的197W,因此对散热和供电的要求也更低,主流玩家装机更加轻松。
游戏性能测试:主要考察1080P和2K分辨率下的3A游戏性能,并且加入DLSS 3测试。
能效比测试,主要考察4060 Ti相比3060 Ti是否更加省电且高效。
考虑到这张卡的显存容量只有8GB,因此游戏测试以1080P和1440P为主,并对支持DLSS 3的游戏加入DLSS帧生成测试成绩。
前面已经提到,DLSS 3是RTX 40系显卡的独门绝技,它包括三大功能“帧生成技术”、“超分辨率(DLSS 2技术)”和“NVIDIA Reflex(提供更低的游戏延迟)”。也就是说,DLSS 3包含了DLSS 2,但比DLSS 2还多一个帧生成技术,能通过插入AI生成的全新帧的方法来获得一倍帧率提升。
目前支持DLSS 3的游戏已经超过30款,而支持DLSS 2的游戏已经有300多款,其中包括Unreal Engine和Unity两大游戏引擎的支持,可见英伟达在游戏领域的影响力和生态圈发展相当迅猛。
采用FurMark对显卡进行压力测试(满载),同时监测出显卡的功耗,得出如下数据。
另外值得一提的是,尽管七彩虹这张RTX 4060 Ti Ultra DUO是双风扇版本,但其实满载下的温度并不高,GPU最高温度仅为68℃,说明散九游会J9 J9九游会热效果还是很给力的。再说这张卡发热量本就不高,因此对于4060 Ti这个级别的显卡完全没有必要去追求三风扇版本,当然喜欢超频和特别在意散热效果的用户除外。
这张七彩虹iGame GeForce RTX 4060 Ti Ultra W DUO OC 8GB显卡的发售价为3199元,目前已经在JD、天猫、抖音等平台开售。从颜值上来说,我个人非常喜欢,细节也非常精致,极适合组建白色主题的海景房主机。
除此之外,4060 Ti的能效比非常好,满载功耗也就160W,对电源的要求很低。同时,低功耗带来的低发热、低噪音等优势也非常显著。总而言之,4060 Ti的优点还是非常突出的,接3060 Ti的班成为装机主力不成问题,后续价格能到3000以内更值得入手。