知之实验室 篇三十一:夭寿啦!RX7900XT翻身啦!——20G大显存的AI新秀,后来居上!
一直以来,提到AI,特别是AI应用,那都是皮衣黄家一个人的天下,可说是一个人追着AMD和INTEL两家猛揍,各类软件、第三方AI框架的适配上也是以NIVIDA为优先,以至于产生了玩AI就得NIVIDA CUDA架构的固有思维。
但是这不代表强者恒强,AMD虽然起步较晚,最近的发展也是大踏步的。尤其是AMD的产品实际上算力更强、规格更高,比如NVIDIA最新一代H800都可以正常销售(虽然没货)的情况下,AMD的AI加速卡Instinct MI300和“特供版”MI309都登榜“美商严选”(美国商务部禁售名单),可见其实力。以至于AMD的股价如今已经是Intel的4倍有余,市值也接近2倍,说明市场对AMD的价值也很认可。下面就请各位随我一起来了解一下AMD的逆袭史。
RDNA3雄起!
RDNA 3算是AMD Radeon发起全面反击的“冲锋号”,2022年末发布的RX 7000系列显卡,凭借RNA3的全新架构,流处理器模块双路派发,大大提升了指令分发的效率,而且能更好的调用计算单元,使更高效的利用混合指令。同时,每个结算单元配置两个AI加速器,加入新的指令,提升吞吐量,相较RDNA2,实现200%+的提升。虽然在绝对的游戏性能上并不占上风,但是在性价比上,AMD从没输过!更何况厚积才能薄发,正是有了强大的硬件基础,后期的补强才能有巨人的肩膀可以站。
ROCm是什么东西?
Radeon Open ComputePlatform(ROCm,Radeon开放计算平台),发布于2016年,经过漫长的“蠕动式发展”,尽管进行了开源,但是作为第一方对抗CUDA的门面,并没有出现“源神,启动!”的神迹。我感觉很大一方面原因就是限制太多,Linux+Radeon Pro专业卡+Radeon Instinct加速计算卡这种要求,真真闹麻了,门槛这么高,注定曲高和寡。
缓过神来的AMD赶紧调转枪头,2023年4月突然宣布ROCm将正式登陆Windows平台,并且宣布支持Radeon游戏显卡。首批对RX6900 XT和RX6600进行部分支持,这也是AMD的一贯作风,心里始终装着我们这些臭打游戏的。到了2023年11月,伴随着AMD ROCm 5.7的正式发布,除了引入对PyTorch的支持外,RDNA3架构的三款GPU成功被纳入支持范围,分别是RX7900XT、RX7900XTX和PRO W7900,这其中RX7900XT算是最后时刻压哨入围,成为当时最便宜的ROCm选择。
今年2月,ROCm迎来大版本号的更新,全新的ROCm 6.0版本在之前基础上加入了对W7800和RX7900GRE的支持,并宣布兼容ONNX Runtime,可以让开发人员在不同架构间无缝转换AI模型,扩大的本地大模型的易用程度上,在追赶CUDA的征途上大踏步的迈进。
C(划去)ZLUDA参战!
就在ROCm 6.0上线的当月,还有一个大事件发生,就是ZLUDA宣布开源,这个项目由AMD与开发者 Andrzej Janik签约(此时Janik还是一个蓝厂员工)进行共同开发的,目的是实现CUDA应用在AMD硬件当中的运行,不过随着AMD将全部精力投入到AMD ROCm的研发和迭代,Janik选择拥抱开源,并在Github更新issues说明了具体情况。
有兴趣了解更多的坛友可以参考Phoronix上的文章:
https://www.phoronix.com/review/radeon-cuda-zluda
Janik的项目虽然还有一定的局限性,但无疑已经取得了阶段性的成功,特别是在Blender 4.0的渲染测试中,ZLUDA的性能甚至高于原生的AMD ROCm 10%以上。
伴随着3月Lisa Su女士在北京AMD AI PC创新峰会上的发言,人工智能正在推动一场革命,迅速重塑科技行业的方方面面。从数据中心到AI PC和边缘计算,AMD对这个全新计算时代的机遇感到兴奋。AMD AI将更进一步对各类使用环境实现赋能,寻求更大的突破和发展。
AI,正在走近我们
上面谈了这么多,到底我们需要一个什么样的GPU来开启AI之旅,在这里,我诚挚的向大家推荐本文的主角,目前最具性价比的AI高端显卡:AMD Radeon RX 7900 XT 20GB。
这也是著名AI方案解决商-Tiny应对目前上市场货源紧张的“性价比”方案。他们使用6张7900XT通过PCIe 4.0 x16通道进行连接,总共高达120GB GDDR6显存的六张显卡理论上可提供738 TLFOPS 的 FP16 性能!
目前XFX的拳头产品海外版Pro到手5399才是好价
瀚铠 7900XT星空 5299
盈通 樱瞳水着 sugar 5399 叛逆与自由交织!!!(振声)
白色颜值无光款 蓝宝石 7900XT 极地版 则从5299回到了5699高位,如果不着急入手,建议再蹲一蹲好价。
推荐的原因有几点,首先还是RX7900XT的性能强悍,相较于竞品4070ti家族,4070ti虽价格相近,但是有明显的显存容量优势,在需要占用大量显存的AI运算中有较大的余量,使用更余裕,而4070ti S在皮衣黄的精湛刀法下,虽然显存来到了16G,但是价格也多是到了7000往上走,是两个不同的价格区间。这里参考电脑吧评测室4月14日的跑分结果,3Dmark TS 25600+,远高于4070ti S,大表哥2 4K 140fps,2077 4K光追中档也有60+fps,说明7900XT在4K游戏方面的不凡表现。
而目前AI方面应用最多的文生图场景,秋叶大佬也已经在“绘世”最新的整合包装加入了对ZLUDA的支持,下载最新的HIP SDK就可以开搞,想一步步体验部署过程的,则可以在某乎搜索“AMD显卡在WINDOWS下满血运行Stable diffusion,ZLUDA详细使用教程”感受一步步从无到有的感受。在出图速度上,4070ti S再次被拉踩,同时正如我之前提到的20G的显存确保了更大的余量。
从目前情况来看,随着AMD在AI方面探索的不断深入,进入5000-5500这个价格区间的7900XT,在这个显存为王的AI时代,无疑是游戏+AI领域俩手抓的一个优质选择:20GB,后来居上!
作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~
pxyplay
校验提示文案
段翔
校验提示文案
我要中奖请满足我
校验提示文案
zstarweb
CUDA都积累多少年了,现在还追那么容易?
校验提示文案
伊萝子
校验提示文案
_winsome_
校验提示文案
牛胖胖
校验提示文案
废土拾荒人
校验提示文案
水瓶双鱼
校验提示文案
pxyplay
校验提示文案
水瓶双鱼
校验提示文案
废土拾荒人
校验提示文案
段翔
校验提示文案
我要中奖请满足我
校验提示文案
zstarweb
CUDA都积累多少年了,现在还追那么容易?
校验提示文案
牛胖胖
校验提示文案
_winsome_
校验提示文案
伊萝子
校验提示文案