AMD RX 7900 XT Linux AI性能體驗
一、ROCm:一個可移植、高性能的GPU計算平臺
隨著AI時代的來臨,顯卡的作用不再僅僅只局限于游戲,特別是在Stable Diffusion火爆全網之后,越來越多的玩家將顯卡當成AIGC生產力工具。
只不過,Stable Diffusion的早期版本對AMD顯卡支持不太友好,給大家造成了只有N卡才適合玩AI的錯覺。
可能很多同學不知道的是,AMD的Radeon GPU也是能夠做深度學習的,而且性能也并不差。
去年12月份,AMD推出的ROCm 6.0開發(fā)平臺進一步優(yōu)化了RX 7000系列顯卡的AI性能,特別是Stable Diffusion的出圖效率更是獲得了翻倍提升。
這里先解釋一下什么是AMD ROCm!
ROCm (Radeon Open Compute Platform )是 AMD 基于開源項目的 GPU計算生態(tài)系統(tǒng),類似于 NVIDIA 的 CUDA。
ROCm 支持多種編程語言、編譯器、庫和工具,以加速科學計算、自動駕駛、人工智能和機器學習等領域的應用。
ROCm還支持多種加速器廠商和架構,提供了開放的可移植性和互操作性。
目前深度學習開發(fā)一般都是使用Python,而大數據平臺往往都會部署在Linux操作系統(tǒng)之上。因此,AMD ROCm目前主要精力放在Linux系統(tǒng)上,Windows端則還有待完善。
得益于雙發(fā)射設計的流處理器單元,RX 7900 XT僅憑5376個流處理器就達到了52TFOPS的單精度浮點運算性能,而擁有10240個流處理器的RTX 4080 Super浮點性能同樣則是55TFOPS。
至于RX 7900 XTX,其單精度浮點性能則接近60TFOPS。
Stable Diffusion主要依賴GPU的單精度浮點性能以及顯存容量與帶寬,這兩方面RX 7900 XT都不遜于RTX 4080 SUPER,甚至顯存容量還更大一些。
現在有了AMD ROCm 6.0的加持,終于可以發(fā)揮出這張頂級顯卡強大的AI算力。
二、Stable Diffusion出圖速度對比:Linux系統(tǒng)下出圖效率近乎翻倍
測試平臺如下:
本次我們主要對比RX 7900 XT/XTX在Ubuntu與windows系統(tǒng)下的出圖效率,看看AMD ROCm到底能帶來多大提升。
1、RX 7900 XT對比測試
首先是Windows 11系統(tǒng),打開Stable Diffusion之后,我們設置DPN++ 2M Karras采樣、迭代步數50、Euler a采樣、1024x768分辨率、CFG為7、總批次10,單批數量1。
在Windows系統(tǒng)下,RX 7900 XT基于DirectML加速模式生成10張圖共計耗時9分51秒,也就是591秒。
進入Ubuntu 22.04.3 LTS系統(tǒng),設置好ROCm之后,同樣的參數與模型生成10張圖只用掉了5分05秒,即305秒。
對比之下,在Ubuntu 22.04.3 LTS系統(tǒng)下,RX 7900 XT的出圖效率相比Windows系統(tǒng)高了足足94%。
2、RX 7900 XTX對比測試
使用同樣的參數來測試RX 7900 XTX顯卡。
在Windows系統(tǒng)下,RX 7900 XTX基于DirectML加速模式生成10張圖總計耗時9分18秒,也就是558秒。
進入Ubuntu 22.04.3 LTS系統(tǒng),設置好ROCm之后,同樣的參數與模型生成10張圖只用掉了4分45秒,即285秒。
在Ubuntu 22.04.3 LTS系統(tǒng)下,RX 7900 XTX的出圖效率相比Windows系統(tǒng)領先了96%,也就是近乎翻倍的性能提升。
三、小結:高性價比的AIGC顯卡
目前一張非公RX 7900 XT售價在5299元左右,對位的非公RTX 4080 Super售價則是8599元,N卡貴了60%。其實在游戲性能方面,這兩款顯卡并沒有太大差距。
現在AMD也意識到了AI應用對于GPU的重要性,加大了對AMD ROCm平臺的投入,經過不斷的更新,如今AMD ROCm 6.0在AI算力方面的提升早已超出了大多數玩家的認知。
在我們的測試中,RX 7900 XT在Linux系統(tǒng)下使用Stable Diffusion ROCm 6.0版時,其出圖效率幾乎是Windows系統(tǒng)的2倍。再加上55TFOPS的單精度浮點運算性能以及20GB GDDR6X超大容量顯存,對于有較高專業(yè)AIGC應用需求的專業(yè)用戶而言,在有限的預算下,RX 7900 XT可以說是非常適合的選擇。
當然,也希望AMD能夠繼續(xù)優(yōu)化ROCm在Windows系統(tǒng)下的性能表現,讓更多的AMD用戶能擁有屬于自己的高性價比AIGC顯卡。
原文標題 : ROCm加持出圖效率翻倍!AMD RX 7900 XT Linux AI性能體驗

請輸入評論內容...
請輸入評論/評論長度6~500個字
最新活動更多
-
10月23日火熱報名中>> 2025是德科技創(chuàng)新技術峰會
-
10月23日立即報名>> Works With 開發(fā)者大會深圳站
-
10月24日立即參評>> 【評選】維科杯·OFweek 2025(第十屆)物聯網行業(yè)年度評選
-
即日-11.25立即下載>>> 費斯托白皮書《柔性:汽車生產未來的關鍵》
-
11月27日立即報名>> 【工程師系列】汽車電子技術在線大會
-
12月18日立即報名>> 【線下會議】OFweek 2025(第十屆)物聯網產業(yè)大會
-
10 大模型的盡頭是開源
- 1 特斯拉工人被故障機器人打成重傷,索賠3.6億
- 2 【行業(yè)深度研究】退居幕后四年后,張一鳴終于把算法公司變成AI公司?
- 3 人形機器人廠商,正在批量復刻宇樹G1
- 4 AI 時代,阿里云想當“安卓” ,那誰是“蘋果”?
- 5 華為公布昇騰芯片三年計劃,自研HBM曝光
- 6 硬剛英偉達!華為發(fā)布全球最強算力超節(jié)點和集群
- 7 機器人9月大事件|3家國產機器人沖刺IPO,行業(yè)交付與融資再創(chuàng)新高!
- 8 谷歌“香蕉”爆火啟示:國產垂類AI的危機還是轉機?
- 9 00后華裔女生靠兩部AI電影狂賺7.8億人民幣,AI正式進軍好萊塢
- 10 美光:AI Capex瘋投不止,終于要拉起存儲超級周期了?