Stable Diffusion XL搞偏门:AMD性价比神卡

2024-04-01 00:15:11 146点赞 553收藏 123评论

故事的起源:

在这个充满科技奇迹的时代,恰逢我家的领导是一位朴素的做平面设计的同学,她每天都在和各种线条、色块和创意做斗争。没办法,都是为了生活,自从我介绍给她用Stable Diffusion后,并且把闲置的RTX3070+5900X搭成AI绘图专用Server给她用了之后,她就停不下来了,这样陆陆续续用了Stable Diffusion陪伴她工作了大半年,由于家里领导使用AI绘图后,经常会递交惊艳的作品,屡屡受到她上司的表扬,减负又加薪,自然的,她就更加一条路走到黑,再也离不开了。后面她不知从哪里听闻Stable Diffusion XL发布了,那就给她升级吧,Ubuntu 同步下最新代码,下载几个模型,升级倒是毫无难度,但无奈噩梦就此开始,由于SDXL是1024x1024的图训练的。所以,稍微开点插件,或者分辨率一大,3070 8G的显存就不够用,CUDA Out Of Memory。此类事情,领导天天啰嗦我,说要影响她创作了,手上别的没有更大显存的卡,我只有把华硕4090插过去给她临时用了几天。这一用,卡都不还给我了,于是申请再买一张卡用于搞AI,吃过3070的苦后,家里领导说她说就要显存大,要24G起步,说买我那个游戏卡也行,或者其他完全性能弱一丢丢能接受。由于众所周知的原因,当初为了买4090,谎报了5000元单价,领导还是记事的,果不其然,她转我5000,让给她重新买一张,我才能拿走我的4090。

悲剧!猝!

要知道5000元买全新的3090都要倒贴,而且矿卡横行,二手N卡不敢入手,生产力工具,要买就买全新的,就在我犯愁如何用这5000元买一张堪用的绘图卡的时候,转机出现了。一个偶然的机会,跟朋友提起这个事,他说也在玩SDXL,不过是AMD,专业AI卡,32GB显存,不俗的AI绘图性能,在某鱼全新不到5字头的价格,追问之下知道,此物就是AMD MI100,但此卡缺点也明显,他只能跑AI,因为无显示输出,游戏也是不太可能。但!这刚好符合我需求,无输出不重要,我只要能跑SDXL,毕竟是生产力工具。而且我本来就是跑Ubunu系统,问题不大,所以,所有的这些问题对我都不是问题。只要他性价比够高!

就这么干吧!

最终对比了几个卖家后,凭借三寸不烂之舌,以4.5K的价格,入手了一张全新的(有点惊讶到我,再怎么说此卡也是敢对标A100的神物,因为此卡是被动散热的,我又花了几十元补了个散热器。我擦,5000元居然还有剩),两天后卡和散热器都到了,纸壳内就是如此简陋的工包。金手指完美,确实没上过机,是全新货。但拆开后,惊艳了我,不愧是发行价4.8万的货。

AMD MI100 简陋工包AMD MI100 简陋工包艺术品一样!艺术品一样!用料扎实,秒杀一众消费级显卡!用料扎实,秒杀一众消费级显卡!

这元器件布局,不夸张说,商业级的,就是强。用料真的不惜血本啊。发行时候,号称性能超越A100。

官网部分参数,充满期待:

Stable Diffusion XL搞偏门:AMD性价比神卡

查了一下发行价4.8万人民币,不到1/10的发行价入手,心里乐呵呵,迫不及待上散热器,参考了SMZDM的教程和百度的教程,驱动两下就安装好了,不得不说A卡在Ubuntu下的驱动安装比N卡还要顺畅。。然后很快就搭好了Ubuntu下基于ROCm下的SDXL环境,对于熟悉Linux的人应该也不算难,线上文章太多了,就不重复叙述,新手按照教程问题应该也不大,我这里装的是最新的ROCm 6.0+最新的SDXL。

rocm信息:rocm-smirocm信息:rocm-smi

OK,性能测试准备开始,Let’s Go!

对比平台,刚好3个卡:

丽台3070 8GB / 华硕4090 24GB / AMD MI100 32GB

其他部分硬件配置:

CPU: AMD 5900X

主板:微星 B550M Motar

内存:威刚 DDR4 3200128GB(32GB x 4)

系统盘:M.2 2T

电源:长城800W金牌

其他软件信息:

Ubuntu 版本:22.04.3

WebUI 版本:v1.8.0

Python 版本:3.11.5  

torch:2.4.0dev 20240326

首先外观对比,3名选手登场,MI100竟然是个头最小的。

从上到下分别是4090,3070,MI100从上到下分别是4090,3070,MI100

宽度对比,MI100依然是最苗条的

从上到下4090,MI100,3070从上到下4090,MI100,3070

准备SDXL的启动参数,几个卡启动参数有点小差别,

MI100的启动参数如下:

python3 launch.py --listen --port 7860 --opt-split-attention-invokeai --enable-insecure-extension-access --opt-split-attention

4090,增加xformers,此为N卡支持选项, --xformers

而3070,同样开启xformers,当然还有因为他只有8G显存,因此开启中等显存参数—medvram。

在浏览器输入IP:7860后,就可以开始对比测试了。

Stable Diffusion启动画面Stable Diffusion启动画面

来了,来了,来了,颤抖的小手!

选用模型:realisticStockPhoto_v20.safetensors

从网上找了个prompt,开测:

A stunning, lifelike woman with high-definition features, wearing an elegant evening gown, in a sophisticated and alluring pose,4k epic

生成的图还是很不错的生成的图还是很不错的

因为只看基础对比性能,清华采样器啥,加速绘图的优化暂时都没做,分别测试1024x1024,1536x1536,2048x2048这3种宽高,同时也没做超分。

1024x1024,迭代步数50,批次101024x1024,迭代步数50,批次101536x1536,迭代步数50,批次41536x1536,迭代步数50,批次4

不管是MI100还是4090,生成过于大的宽高比例,容易出现两个头三只手等走样照片,这个应该是跟模型的原始素材尺寸有关,不过不重要,此处只看性能,为了避免吓人,加上人类最伟大的发明——克兄

2048x2048,迭代步数50,批次12048x2048,迭代步数50,批次1

交差,完美完成任务。

集中常见分辨率下的对比集中常见分辨率下的对比

结论:

3070只有8G显存,动不动就Out of memory,实在无法胜任AI绘图,个人建议,SDXL建议16GB起步,最好24GB及以上。

4090仍然是最牛的存在,唯一缺点价格太贵,1.5W+,要弄走好多私房了,虽然MI100纸面数据不差4090太多,但最终SDXL的成绩MI100没有干过4090,差距不小,当然也在意料之中,一来因为AMD的ROCm还在持续优化,而从ROCm 5.7到6.0的提升来看,提升还是很大的。另外对于MI100,它有着更大的显存,能够更好的应对SD 3.0,可能都不是太大问题。况且4.5K价格摆在这里,还要啥自行车。对于只做AI绘图的生产力工具,确实是不错的选择。性能上,当前优化下,不知道能否对标3080-3090,估计还是有点机会,但具体由于我没有平台,没法测试。另外,AMD专用AI绘图平台STARK,可能有更好的表现,但是我懒,也就不测试了。

附上几张随意生成的美图:

Stable Diffusion XL搞偏门:AMD性价比神卡Stable Diffusion XL搞偏门:AMD性价比神卡Stable Diffusion XL搞偏门:AMD性价比神卡Stable Diffusion XL搞偏门:AMD性价比神卡

作者声明本文无利益相关,欢迎值友理性交流,和谐讨论~

展开 收起

AMD Radeon R7 DDR4 台式机内存

AMD Radeon R7 DDR4 台式机内存

暂无报价

GLOWAY 光威 龙武 DDR5 6800MHZ 32GB(16X2)台式机内存条

GLOWAY 光威 龙武 DDR5 6800MHZ 32GB(16X2)台式机内存条

749元起

Asgard 阿斯加特 女武神·瓦尔基里 DDR5 7000MHz RGB 台式机内存 灯条 白色 32GB 16GBx2

Asgard 阿斯加特 女武神·瓦尔基里 DDR5 7000MHz RGB 台式机内存 灯条 白色 32GB 16GBx2

839元起

GALAXY 影驰 HOF PRO DDR5 7000MHz RGB 台式机内存 灯条 白色 32GB 16GBx2 C36

GALAXY 影驰 HOF PRO DDR5 7000MHz RGB 台式机内存 灯条 白色 32GB 16GBx2 C36

999元起

GLOWAY 光威 48GB(24GBx2)套装 DDR5 6800 台式机内存条 龙武系列 海力士M-die颗粒 CL34 助力AI

GLOWAY 光威 48GB(24GBx2)套装 DDR5 6800 台式机内存条 龙武系列 海力士M-die颗粒 CL34 助力AI

1039元起

GLOWAY 光威 48GB套装 DDR5 6800 台式机内存条 神策RGB系列 海力士M-die颗粒 CL34

GLOWAY 光威 48GB套装 DDR5 6800 台式机内存条 神策RGB系列 海力士M-die颗粒 CL34

1199元起

PREDATOR 宏碁掠夺者 Vesta II 炫光星舰系列 DDR5 6800MHz RGB 台式机内存 灯条 银色 32GB 16GBx2 C32

PREDATOR 宏碁掠夺者 Vesta II 炫光星舰系列 DDR5 6800MHz RGB 台式机内存 灯条 银色 32GB 16GBx2 C32

1049元起

GLOWAY 光威 48GB套装 DDR5 5600 台式机内存条 天策系列 助力AI

GLOWAY 光威 48GB套装 DDR5 5600 台式机内存条 天策系列 助力AI

699元起

PREDATOR 宏碁掠夺者 Vesta II 炫光星舰系列 DDR5 6800MHz 台式机内存 灯条 银色 32GB 16GBx2 C34

PREDATOR 宏碁掠夺者 Vesta II 炫光星舰系列 DDR5 6800MHz 台式机内存 灯条 银色 32GB 16GBx2 C34

949元起

KINGBANK 金百达 白刃 DDR5 6800MHz RGB 台式机内存 灯条 C34

KINGBANK 金百达 白刃 DDR5 6800MHz RGB 台式机内存 灯条 C34

335元起

GLOWAY 光威 神策系列 DDR5 6400MHz RGB 台式机内存 灯条 皓月白 32GB 16GB*2 海力士A-die CL34

GLOWAY 光威 神策系列 DDR5 6400MHz RGB 台式机内存 灯条 皓月白 32GB 16GB*2 海力士A-die CL34

899元起

GLOWAY 光威 龙武系列 DDR5 6400MHz 台式机内存 马甲条 海力士M-die颗粒

GLOWAY 光威 龙武系列 DDR5 6400MHz 台式机内存 马甲条 海力士M-die颗粒

659元起

KINGBANK 金百达 银爵系列 DDR5 6400MHz 台式机内存 马甲条 白色 32GB 16GB*2 海力士A-die颗粒

KINGBANK 金百达 银爵系列 DDR5 6400MHz 台式机内存 马甲条 白色 32GB 16GB*2 海力士A-die颗粒

299元起

KINGBANK 金百达 刃SHARPBLADE系列 DDR4 4000MHz RGB 台式机内存 灯条 白色 32GB 16GB*2

KINGBANK 金百达 刃SHARPBLADE系列 DDR4 4000MHz RGB 台式机内存 灯条 白色 32GB 16GB*2

569元起

KINGBANK 金百达 32GB套装 DDR5 7600 台式机内存条海力士A-die颗粒 白刃RGB灯条 C36

KINGBANK 金百达 32GB套装 DDR5 7600 台式机内存条海力士A-die颗粒 白刃RGB灯条 C36

999元起

Asgard 阿斯加特 32GB(16Gx2)套装 DDR5 7000 台式机内存条 金伦加&TUF 海力士A-die

Asgard 阿斯加特 32GB(16Gx2)套装 DDR5 7000 台式机内存条 金伦加&TUF 海力士A-die

789元起
123评论

  • 精彩
  • 最新
提示信息

取消
确认
评论举报

相关好价推荐
查看更多好价

相关文章推荐

更多精彩文章
更多精彩文章
最新文章 热门文章
553
扫一下,分享更方便,购买更轻松