Valve 的開發人員 Natalie Vock 通過 Mesa 為 Linux 上的 AMD GPU 帶來了更令人印象深刻的性能改進。這是在最近合併的基礎上進行的額外工作,這已經令人印象深刻。
第一個請求於 2 天前發送到 Mesa,並已合併,標題為“在 gfx11+ 上使用 wave32 for RT”,他們在請求中指出:
ACO 在形成 VOPD 指令和測試方面有了很大的進步
反饋似乎對此指向了稍微積極的方向。
gfx12 還將開始要求 wave32 進行動態 VGPR 分配
某個點。
navi31 上的測量:
賽博朋克 2077:
95.0% 置信度下的差異
1.12333+/-0.42876
1.88216%+/-0.718391%
(學生 t,匯總 s = 0.189165)
黑神話悟空基準:
95.0% 置信度下的差異
4+/-1.30862
13.9535% +/- 4.56495%
(學生 t,匯總 s = 0.57735)
帶 RTX 的門戶:
66.2ms->61.5ms(約提高 7.64%)

圖為——《賽博朋克 2077》
第二個是大約 20 小時前打開的,標題為“使用函數調用來分離任意命中/相交著色器編譯”,同樣令人印象深刻:
我們終於有了光線追踪的函數調用!
現在,讓我們用它們來做一些很酷的事情。
借助此 MR,RADV 可以分別編譯任意命中著色器和交叉著色器。不再需要將所有內容強制內聯到一個巨大的超級著色器中!在大量使用/編譯任意命中/交叉著色器的遊戲中,這需要在所有 GPU 代上進行一些非常瘋狂的改進:
在具有光線追踪的 UE4 遊戲中編譯 RT 管道(例如 Ghostwire Tokyo、The Callisto Protocol)變得 10次 快點。是的,一個數量級!在我收集的一份 Ghostwire Tokyo Fossilize 截圖中,重播時間從 4 分 20 秒縮短到了 20 秒。
每當編譯新的 RT 管道時,這些 UE 遊戲也往往會出現非常嚴重的卡頓現象。
那種口吃的感覺完全消失了。
最重要的是,運行時性能大大提高 [in affected applications] 以及。誰知道將數百個著色器內聯到一個令人難以置信的熱循環中可能會降低性能? !
根據快速計算,我認為 Ghostwire Tokyo 的純 RT 性能提高了 2 倍以上。無論如何,我的 7900XTX 上的 FPS 從 ~30 變為 ~40。
看起來,在我測試的 Ghostwire Tokyo 場景中,MR 的性能與 Windows 的性能大致相當。
不同應用程序/非 UE4 遊戲的性能改進可能會有所不同,但我確信相當多的應用程序應該會受益。 (但《賽博朋克 2077》則不然。它實際上最多只使用 1 個任意命中著色器,因此不受此 MR 的影響。)
對於 MR 組織:
這是基於 !38679,以便在任意命中著色器中實現良好的寄存器分配。
大多數其他 ACO 提交(529b0546、40b49ff5 和 9702e59e)都是可選的 – 它們可以提高性能,但是無論有沒有它們,這個 MR 都是有益的。如果願意的話,我可以將它們分配給另一個 MR。
原始來源:Phoronix
希望以後不會發現任何回歸,但我完全不是一個專家大腦希望這種情況繼續發生。 2026 年開源 Linux 圖形驅動程序將會非常強勁。
我想這項工作的相當一部分是為了讓新的蒸汽機做好準備。
至於下一個 Mesa 何時發布?從發佈時間表來看:
|
分支
|
預計日期
|
發布
|
筆記
|
|---|---|---|---|
|
25.3
|
2026-01-14
|
25.3.4
| |
|
2026-01-28
|
25.3.5
| ||
|
2026-02-11
|
25.3.6
|
最後計劃的 25.3 版本
| |
|
26.0
|
2026-01-21
|
26.0.0-rc1
|
26.0 分支點
|
|
2026-01-28
|
26.0.0-rc2
| ||
|
2026-02-04
|
26.0.0-rc3
| ||
|
2026-02-11
|
26.0.0-rc4
|
或 26.0.0 最終
|



