APP下载

全民都玩AIGC,你家算力够劲吗?

2023-05-30

电脑报 2023年18期
关键词:算力性价比旗舰

自从ChatGPT一夜之间红遍全球之后,AI出图更是一发不可收拾成为公众关注的焦点。不少企业甚至已经开始使用AI出图代替部分设计师的工作,颇有“不会用AI就要被时代淘汰”的势头。当然,虽然目前AI出图在真实物体细节方面还有较大提升空间,但不能否认的是在未来算力大幅升级、模型大幅进化之后,AI是完全可以胜任部分设计工作的。所以,对AI应用有兴趣的朋友现在可以行动起来开始学习啦。不过,工欲善其事必先利其器,那么玩AI出图,应该用什么电脑呢?

本地AI出图,高效工具不可少

我们知道,目前AI出图分了云端和本地两种计算方式,简单来说在线方式(例如大名鼎鼎的Midjourney)上手難度较低、对本地电脑硬件基本没有要求,而且出图质量下限高,很容易就能制作出比较不错的图,但是屏蔽了不少提示词,所以自由度相对较低。此外,一般来讲效果比较好的AI云端出图高级服务都需要付费,而且国内访问也可能受到一定限制。

而本地运算方式,例如StableDiffusion虽然上手难度高,但扩展性与提示词的自由度极高,因此出图质量上限也极高。最重要的是,StableDiffusion本身以及可用的海量插件与模型都是免费的,自己训练模型也比较方便,更适合广大玩家尝试。

当然,既然是本地计算,要求效率高的话那电脑的硬件性能肯定不能低了。StableDiffusion本地AI出图主要依靠GPU进行计算(CPU也行,但在并行计算这方面显然效率远不及GPU,差了几个数量级),同时对整机的配置也有一定的要求。因此,想要玩AI出图的朋友,升级或者干脆入手一台高效的新电脑是非常有必要的。

延伸阅读:StableDiffusion本地部署注意事项

StableDiffusion的本地部署教程其实很多了,随便一搜一大把,我们这里只简单总结一下大家需要注意的几个点。

●需要安装GIT,这是安装StableDiffusionWebUI的先决条件之一。下载地址:https://git-scm.com/download/win

●需要安装Python3.10运行环境。miniconda下载地址:https://docs.conda.io/en/main/miniconda.html

●使用NVIDIA卡需要安装cuDNN(CUDA深度神经网络库)最新版,最新版才能让RTX40系列发挥出真正的性能。下载地址:http://go.cpcw.com/cudnn2023

要是嫌自己部署太麻烦觉得无从下手,也可以直接下载整合包,解压即可使用。整合包不但包含了StableDiffusion需要的运行环境(如果运行不正常,也可以按照前面的提示安装GIT和Python),也设置了一些预设方案,照顾不同配置特别是不同显存容量的用户,使用起来确实比较方便,特别适合新手入门。

例如B站UP主“秋葉aaaki”制作的共享整合包,目前最新已经升级到V4版,支持CPU和NVIDIA显卡CUDA加速,大家可以自行去B站下载。此外,目前AMD显卡在Windows下只能通过DirectML实现StableDiffusion的AI计算加速(Linux环境下支持面向GPU计算的ROCm开放软件平台,最近ROCm即将登陆Windows),效率远不及NVIDIA显卡的CUDA,所以只有少数整合包加入了AMD显卡需要的DirectML库(用户可自行添加),Intel显卡也差不多是这个情况,因此要本地AI出图,NVIDIA显卡几乎是唯一值得推荐的选择。

本地AI出图的电脑配件怎么选?

前面已经简单提到了本地AI出图主要靠的是GPU计算,不过考虑到整个设计过程并非只包含AI出图或训练模型、或者用户装台电脑来也不是只针对AI应用,很可能还包括其他设计或生产力应用需求,所以对整机配件的选择也是有一定要求的,主要涉及处理器、内存和显卡,而磁盘只要是SSD,足够存放素材与模型文件就可以了,没有特别的要求。

处理器

实际上,就算Intel酷睿i913900K这样的旗舰级处理器,在StableDiffusion中出图的效率也不过大约是NVIDIA显卡旗舰RTX4090的1/256、RTX3090Ti的1/141,出一张768×768、采样步数50的图要费时近13分钟,实在谈不上什么效率。所以只有在电脑没有显卡支持在StableDiffusion中开启硬件加速的情况下,才会轮到处理器临时替补一下。因此,如果只针对AI出图装机,对处理器的性能其实没有什么太高的要求。

不过,就算对处理器没有特别的要求,但一是考虑到整套电脑的配置不能太老旧,必须要有足够的扩展性和升级性,二是考虑到整机还有可能完成其他生产力工作,所以在处理器方面我们制定了不同的选择方向。

●注重性价比,千元级U即可

如果没有其他大型生产力应用的要求,那么一款最新的千元级U足以满足装机需求。Intel方面可以考虑酷睿i513400F,AMD方面可以考虑锐龙57600智酷版。为什么不用更便宜的U?一方面是这两款都能支持PCIe5.0和DDR5内存,未来平台升级PCIe5.0显卡(这一点很重要,按照NVIDIA和AMD现在的做法,以后中低端显卡有很大概率只支持8个PCIe通道,如果处理器或主板不支持PCIe5.0,就会出现带宽减半的问题)与SSD、扩展内存容量更方便一些;另一方面是它们的性能应付主流生产力应用也是能够胜任的,同时在价格上更加亲民。

●注重全能性,可考虑高端多核U

如果电脑还要完成AI出图之外配套的生产力工作(视频剪辑、3D渲染輸出),那就对处理器的多线程性能提出了更高的要求,需要选择核心数量更多的高端型号。在这里我们优先推荐AMD的锐龙7000系列旗舰型号,例如锐龙97950X和锐龙97900X,而Intel酷睿i913900系列和酷睿i713700系列则次之。

究其原因,就是我们在实测中发现,拥有大量能效核的第13代酷睿在运行包括StableDiffusion在内的部分生产力软件时会出现核心分配不正确的问题,导致重负载进程全部分配给了能效核,性能核则处于闲置状态,如此就会使得处理器的运算效率大打折扣。相比之下全是大核的锐龙7000系列就不会出现这样的问题。

内存

既然已经决定了选择锐龙7000或者第13代酷睿平台,那么DDR5内存也是必选了。虽说第13代酷睿也支持DDR4内存,但考虑到整机未来的升级空间和对其他生产力应用的需求,明显也是选择带宽更高的DDR5内存更合适。

容量方面,StableDiffusion不用处理器来出图的话,也不怎么吃内存,32GB绰绰有余。目前内存价格比较给力,双16GB对于主流整机来说也没什么压力,也可以应对更多的生产力应用,所以强烈推荐再省也要上双16GB。

频率部分,虽说更高的内存带宽确实能带来更高的生产力效率,但也要综合考虑性价比的问题,超过DDR56400的内存还是挺贵的,综合下来DDR56400/6000是综合性价比最高的型号。此外,如果选择AMD锐龙7000平台,那么DDR56400也是极限了,不用考虑更高的型号。

显卡

终于说到StableDiffusion出图的主角配件了。前面已经提过,StableDiffusion本地出图首选CUDA生态圈无可替代的NVIDIA显卡,用DirectML实现通用计算的AMD显卡和Intel显卡都属于替补(可以期待AMD显卡Windows版的ROCm实装后会不会有所改善),效率和兼容性都难以与NVIDIA显卡相提并论,与其花时间去解决A卡和I卡在StableDiffusion中的各种问题还不如老老实实用N卡省事。

除了GPU的算力之外,StableDiffusion本地出图最吃的就是显存了,显存越大,出图分辨率也就可以设得越高。以本文后面的文生图测试为例,入门推荐8GB起步,768×768分辨率够用(大约最高占用到6.9GB);再高一些的1024×1024推荐选用12GB显存的型号(最高占用约9GB);再往上可选的就是16GB/20GB/24GB的型号。当然,市场中也有魔改的RTX2060/2080Ti可以做到12GB/22GB显存,但是很明显这类卡没有质保,所以不推荐普通用户冒险。然而拥有海量显存(例如NVIDIAA10080GBPCIe)的专业计算卡就不是大众玩家消费得起的了,这里就不再多说。

此外,最近NVIDIATeslaP40/M40等“古董级”纯计算卡也是AI出图玩家关注的焦点,它们具备超大的24GB显存,而且二手卡价格也非常诱人(M40仅需499元,P40还涨了一波从899元飙到1199元了)。但是,这类计算卡都是被动散热,玩家拿到手需要手动改散热器,而且老旧的Pascal与Maxwell架构功耗也非常高,改起散热来不但成本高,难度也不是普通用户能够HOLD住的。还有最重要的一点,老架构不支持FP16半精度计算,而StableDiffusion在半精度模式下可以大幅提升效率并节省显存占用,这一点也让这些老二手卡价值大打折扣,再加上没有可靠的质保,所以也不推荐普通玩家折腾。

当然,也有一些方法可以降低StableDiffusion对显存的占用,让一些显存不太够的显卡也可以支持更高分辨率出图,例如Xformers、MultiDiffusionwithTiledVAE,这就不在本文讨论范围内了,有兴趣的朋友可以自行研究。

那么,我们正在使用的、可买到的NVIDIA显卡在StableDiffusion中出图效率到底如何呢?我们对此也进行了一个横向测试,大家可以参考一下。

如图可以看到我们的StableDiffusion出图设置,默认使用NVIDIA官方提供的CKPT模型,采样方式为Eulera,采样步数设置为50,CFGScale(提示词相关性)设置为7.5,生成批次为10,每批生成数量为2,图像分辨率为768×768。提示词为:“beautifulrenderofaTudorstylehousenearthewateratsunset,fantasyforest.Photorealistic,cinematiccomposition,cinematichighdetail,ultrarealistic,cinematiclighting,DepthofField,hyper-detailed,beautifullycolor-coded,8k,manydetails,chiaroscurolighting,++dreamlike,vignette”。

從测试结果来看,除了数据条短得都看不见的酷睿i913900K,显卡这边的出图效率基本上就跟价格成正比了,不过RTX4070还是略胜了上代更贵的RTX3080,而且RTX4070本身拥有12GB显存,相比RTX3080的10GB也更有优势一些。但是,虽说在这样的设置下RTX4070Ti比RTX3090略快,但不要忘了RTX3090有海量的24GB显存,比RTX4070Ti的12GB多了一倍,所以在图像分辨率提高到一定程度之后肯定是可以反超的。至于底部的GTX1660Ti,由于显存只有6GB,测试中已经爆显存了,因此效率明显低了很大一截,但即便如此速度也是处理器的7.7倍。

综合来看,对于主流用户来讲,RTX3060其实是个综合性价比相对突出的选择,虽然算力不能与高端卡相提并论,但好在有12GB大显存,甚至比一些高端卡显存还大,可以避免一些爆显存的情况。当然,在资金充足的情况下,显卡自然是越高级越好了,只是需要注意电源的搭配,毕竟出图的时候GPU都是满载状态,电源功率不够那必然是要歇菜的。

AI“设计师”装机推荐,高中低总有一款适合你

经过前面的分析,相信大家已经对StableDiffusion的硬件需求有所了解了。如果还是不知道怎么选择具体的装机配件,我们也给出了低中高三套方案供大家按图索骥。这三套方案除了可以满足StableDiffusion的本地AI出图需求,也能覆盖不同档次的生产力应用。当然,你要用它玩游戏体验也是不错的,毕竟“买前生产力,买后……”,懂的都懂。

基础款:AI出图+轻度生产力应用

对于主流用户来讲,搭载千元U和RTX3060显卡的方案完全够用了。虽然前面我们说过第13代酷睿大小核设计会导致一些生产力应用负载只占用小核从而影响效率,但AI出图主要靠的是显卡,而且千元这个级别酷睿i513400F也确实是最新一代U中性价比最突出的了,何况我们遇到核心分配有问题还可以手动把负载分配给大核来解决。

显卡部分当然是AI出图的重点,从前面的测试可以看到RTX3060出图效率只是略低于RTX3060Ti,但它拥有12GB大显存,可以支持更高分辨率出图,价格方面也要比RTX3060Ti低不少,如果从AI出图需求来看,主流配置选用RTX3060性价比确实更高。这里我们选择的是技嘉RTX3060风魔12GB显存版(注意RTX3060也有8GB显存版,不要买错了),双风扇设计完全能HOLD住散热,长时间计算出图不用担心稳定问题。

主流款:全能型设计师电脑

全能型设计师电脑更多地考虑到了用户对于AI出图之外的生产力应用需求,因此处理器方面选择了全大核、12核24线程的锐龙97900智酷版,不存在进程分配不正确的问题,同时不带X的锐龙97900不开PBO满载功率仅有90W,性能相对锐龙97900X差距不到10%,因此在2000元级U中性价比非常高,不管是视频剪辑还是3D渲染输出,都可以提供不错的效率。

显卡部分则直接上了最新的RTX4070,从算力来讲RTX4070已经小超了10GB显存版的RTX3080,而且它的满载功率也不过200W水平,对散热和供电的要求都低于RTX3080,长时间AI出图更稳定、更节能。同时RTX4070显存也多出2GB,价格也更低,综合来看很明显比RTX3080更值得选择。技嘉RTX4070风魔也是走性价比路线的甜品级RTX4070代表,3风扇散热设计对付200W功率的RTX4070毫无压力,同时噪声也可以控制到更低的程度。

旗舰款:高效生产力利器

旗舰款配置可以说是一套高效生产力利器了,16核32线程的旗舰U锐龙97950X全大核设计不用担心核心分配问题,相比酷睿i913900K在某些生产力应用中只能手动分配8个大核的适应性优势明显,从这一点来看它确实比核心数量更多的酷睿i913900K更占优势。

显卡部分,我们这里就选择了RTX4080,拥有16GB超大显存,高分辨率AI出图效率更高。从前面的测试也可以看到,RTX4080的AI出图效率已经超越了RTX4070Ti大约30%。同时,RTX4080这个级的旗舰N卡在视频剪辑、3D设计方面的加速能力也是非常强大的,特别适合有高端设计需求的用户选择。RTX4080猎鹰则是技嘉RTX4080显卡家族中的高性价比款,用不到万元的售价就做到了旗舰级的供电与散热规格,长时间满载出图也不用担心散热和稳定性的问题,这让整套旗舰配置的购买价值也得到了进一步提升。

总结:做好准备“战未来”,和AI共同进化

前有ChatGPT,后有AI出图,今年AI应用突然的大众化让我们感受到AI时代强烈的冲击,AI甚至在某些应用范围内已经部分代替了人工(特别是视觉设计类和文案策划类)。不过,AI作为生产力工具,本来就是为人类服务的,我们现在要做的只是去学习如何使用这种高效的工具。在未来,会用AI完成各种工作就像现在用Office软件办公一样普及,可能也会成为就业的必备技能。因此,想要不落后于时代,就和AI一起进化,做好准备“战未来”吧!

猜你喜欢

算力性价比旗舰
卫星通信在算力网络中的应用研究
电动旗舰来了!试驾BMW i7
算力网络中基于算力标识的算力服务需求匹配
这才是旗舰SUV 试驾全新一代路虎揽胜
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
沃尔沃发布全新纯电旗舰SUV EX90
基于SiteAI算力终端的交通态势感知系统
买房,要的就是性价比
旗舰,你是谁
性价比再度提升 Velodyne Acoustics(威力登)Impact 12 MKII