目前 Linux 上有點缺乏的一件事是開源 Mesa RADV 驅動程序的光線追踪性能,但一項重大改進即將到來。毫不奇怪,這要歸功於 Valve 的資助,他們不斷改進 Linux 圖形驅動程序。
開發商 Natalie Vock 是 Valve 的獨立承包商,她已於 1 月 3 日提交了合併請求,該請求應該會帶來一些不錯的改進。但要明確的是,這是尚未實現的代碼 然而 被拉入梅薩,在此之前可能還需要做更多的工作。
正如沃克在其中所說:
很久以前,在 !26105(合併)中,我發現具有 8×4/8×8 工作組且調度高度為 1(1D 調度)的未對齊調度 不是 可以很好地協同工作,並將每個波的佔用限制為 8 個線程,這絕對會破壞性能。
MR 中的解決方法適用於直接調度,將 Y 維度中的調度大小固定為 >4(或 >8)個線程。當然,固定調度大小僅適用於直接調度,其中大小在命令記錄時已知。當時,我認為這種邊緣情況是可以接受的。畢竟,有人會調度具有 1D 調度大小的間接 TraceRays 的可能性有多大?當然沒有人會這樣做,尤其是廣泛採用的光線追踪全局照明解決方案中最普遍的高保真遊戲引擎之一……
該 MR 還解決了間接 RT 邊緣情況,根據調度大小放棄對 CPU 的任何修改。相反,我們分派 1D 工作組並將所有混合邏輯移至 RT prolog。
實現我們自己的混合邏輯還使我們能夠更智能地處理 Z 順序曲線中的混合模式和排列調用。
應在 UE5 的 HW Lumen 通道中提供約 4 倍至 8 倍的加速,在我的粗略測量中相當於總 FPS 增益約 30%。
歡迎對改進的混合邏輯是否也改善其他 RT 工作負載進行基準測試!
這些都是一些大膽的主張,但沒有理由懷疑它,它們都是任何人都可以測試的公共代碼。當然,有人確實完成了一些早期測試。在評論中,一位用戶發布了他們自己在應用補丁之前和之後的基準測試,結果令人驚訝。正如他們指出的:
| 遊戲 | 前 | 後 |
|---|---|---|
| 紊亂 | 51幀/秒 | 89幀/秒 |
| 層層恐懼 (2023) | 75幀/秒 | 98幀/秒 |
| 遺忘重製版 | 45幀/秒 | 56幀/秒 |
| 寂靜嶺 2 重製版 | 40幀/秒 | 60幀/秒 |
他們沒有列出他們擁有的計算機規格或每個遊戲使用的設置,但這仍然是一個不錯的勝利。
到今年晚些時候推出將使用 Mesa 的 AMD RADV 驅動程序的新 Steam Machine 時,我們有望在許多遊戲中看到一些相當出色的性能。
來源:Phoronix



