9月20日的GTC活動上,英偉達CEO黃仁勛在演講中發(fā)布了萬眾矚目的英偉達新一代游戲顯卡 RTX40系列。
本次英偉達共發(fā)布了三款顯卡,分別是RTX 40系旗艦顯卡RTX 4090與定位高端的RTX 4080 16GB、RTX 4080 12GB。
RTX 40系列顯卡采用了新一代RTX架構(gòu),計算能力再次實現(xiàn)跨越式發(fā)展。而光追技術(shù)的全新升級與DLSS3的加入,也為游戲玩家?guī)砹巳碌纳夡w驗。
RTX 4090顯卡將在10月12日上市,而RTX 4080顯卡則將在11月上市。
加量也加價,40系顯卡性能、價格雙「越級」
RTX4090采用了全新的第三代RTX架構(gòu),并使用臺積電4N工藝制造。
新一代RTX以世界上第一位計算機程序員Ada Lovelace的名字命名,黃仁勛在演講中表示,得益于英偉達與臺積電的緊密合作,專為GPU制造優(yōu)化的4N工藝讓Ada Lovelace架構(gòu)能夠集成760億個晶體管和超過18000個CUDA核心,較上一代Ampere架構(gòu)多70%,能耗比相較Ampere則提升一倍。
采用了Ada架構(gòu)的40系顯卡在性能表現(xiàn)上遠遠超過前輩30系顯卡。
旗艦定位的RTX 4090集成了760億個晶體管、16384個CUDA核心,并擁有24GB顯存。
英偉達表示,在強大硬件指標(biāo)的加持下,RTX 4090顯卡即使在4K分辨率下,依然可以獲得超過100FPS的流暢游戲體驗。
能效方面,RTX 4090功率為450W,與RTX 3090Ti保持一致,但英偉達稱在同樣功率下,4090的游戲表現(xiàn)較RTX 3090Ti提升一倍。
定位低一檔的RTX 4080則有16GB與12GB兩個顯存版本,16GB版本集成了9728個DUDA核心。英偉達稱RTX 4080 16GB的游戲性能兩倍于RTX 3080,并超過了上一代旗艦RTX 3090 Ti。
而12GB版本的RTX 4080則集成了7680個CUDA核心,理論性能也超越了上一代旗艦RTX 3090 Ti。
全新架構(gòu)還搭載了Opacity Micromap引擎,將光線追蹤的Alpha-Test集合性能提升2倍。全新的Micro-Mesh引擎則能夠在不帶來更多的BVH構(gòu)建和存儲資源消耗的前提下提升圖形的豐富度。
最后,全新Tensor Core新增了Hooper FP8 Transformer Engine可以提供1.4 petaFLOPS張量處理性能。在性能獲得巨大升級的同時,這一代英偉達游戲顯卡的價格也再創(chuàng)新高。
RTX 4090建議零售價為12999人民幣起,相比上一代RTX 3090 11999元的其售價漲價1000元。
而RTX 4080價格則上探到了9499元,相較上一代RTX 3080 5499元的起售價可謂完成“消費升級”。即使結(jié)合英偉達本代顯卡將沒有RTX 4080Ti的傳聞,RTX 4080 16GB的其售價也比上一代同定位的RTX 3080 Ti的9499元略有提價。
更低配置的RTX 4080 12GB的其售價也高達7199元,與上一代同定位的RTX 3070Ti的4499元售價也漲勢兇猛。
光追再升級,游戲中AI“偷天換日”
本次RTX 40系列顯卡最重要的升級之一就是對光線追蹤技術(shù)的升級。
RTX系列顯卡最初問世就以光線追蹤為特色功能,本次40系的更新更是“牙膏擠爆”,正如英偉達CEO黃仁勛所說:“英偉達重新定義了圖形。”
新的Ada Lovelace架構(gòu)具有高達90TFLOPs的著色器能力,吞吐量超過上一代產(chǎn)品兩倍。除此之外,Ada架構(gòu)的SM多單元流處理器還使用了著色器重排序技術(shù)(SER),可實現(xiàn)對任務(wù)的實時重新調(diào)度。黃仁勛強調(diào)這項技術(shù)對GPU來說是革命性的,原理上與CPU的亂序執(zhí)行技術(shù)類似。
對于這項技術(shù),黃仁勛在演講中解釋道,光線追蹤的工作負(fù)載需要不同的線程處理,不同著色器之間很難合并工作,SER技術(shù)則能夠即時安排著色器負(fù)載,從而提高執(zhí)行效率,更好地利用GPU資源,打造更好的光線追蹤效果。
這項技術(shù)能夠讓英偉達顯卡光線追蹤性能提升2-3倍,整體游戲性能提升25%。
在提升計算能力之外,英偉達還通過多種方式提升終端游戲體驗。在演講中,黃仁勛表示,和加速計算一樣,計算機圖形的也是一項全棧挑戰(zhàn)。要實現(xiàn)突破還需要在架構(gòu)、設(shè)計和算法上創(chuàng)新。
此前在RTX顯卡上始終扮演著重要角色的DLSS技術(shù)本次也迎來了重大更新。
在RTX顯卡上,DLSS技術(shù)一直是光線追蹤技術(shù)的重要“搭檔”:光線追蹤模擬出更真實、更貼近現(xiàn)實效果的游戲場景,DLSS技術(shù)則利用AI算法降低模擬這樣的真實物理環(huán)境所需要的計算量,保證用戶流暢的游戲體驗。
這次,第三代DLSS技術(shù)同RTX 40系顯卡一同登場,并帶來了開創(chuàng)性的光學(xué)多幀生成功能。
與之前最大的不同在于,第三代DLSS技術(shù)生成的不再是像素,而是全面的畫面幀。
基于Ada Lovelace架構(gòu)的新光流加速器,第三代DLSS技術(shù)可以分析兩幀連續(xù)的游戲圖像,并向神經(jīng)網(wǎng)絡(luò)輸入像素級的從幀到幀的運動方向和速度信息,此后神經(jīng)網(wǎng)絡(luò)模型將據(jù)此計算出中間幀。
這樣的中間幀由神經(jīng)網(wǎng)絡(luò)計算生成,不再涉及圖形渲染,完全獨立于游戲。這能夠大大減輕游戲中即時演算的運算量。
通俗的講,游戲中的畫面是由GPU這個“畫家“通過算力的”畫筆“創(chuàng)造的,DLSS3技術(shù)能在兩張畫作之間插入了一張AI生成的”照片“,從而徹底解放GPU”畫家“的雙手。
英偉達表示第三代DLSS技術(shù)相較于單純渲染的方式可以將游戲性能提高4倍。
黃仁勛表示,DLSS 3能夠為Ada GPU帶來遠高于CPU可計算的幀率,從而讓一些對CPU要求較高的游戲也從中受益。
在現(xiàn)場,英偉達展示了兩款對CPU要求較高的游戲,在開啟DLSS3后,《賽博朋克2077》與《微軟模擬飛行》的幀率增加都超過一倍,達到90幀以上。
《傳送門》連接過往與將來,英偉達沖向元宇宙
游戲,是RTX 40系列發(fā)布時一個重要話題。
在發(fā)布40系顯卡的同時,本次英偉達還頗有復(fù)古精神的帶來了經(jīng)典游戲《傳送門》重制版。
這款被稱為《傳送門RTX》的游戲,實際上是英偉達基于其元宇宙創(chuàng)作平臺onmiverse創(chuàng)建的一個mod。
英偉達巧妙地用《傳送門》,連接起了過去和未來。
正如這一經(jīng)典游戲的玩法:開啟傳送門,走向另一端。
在英偉達看來,傳送門的另一端無疑是屬于元宇宙的世界。
黃仁勛表示,mod是一種受眾龐大的游戲文化,各種游戲mod每年下載量已經(jīng)突破數(shù)十億次。在10款最熱門的競技游戲中,有9款都能見到mod的身影。
英偉達為游戲mod設(shè)計者打造了一款名為RTX Remix的Ominverse應(yīng)用。
基于該工具,游戲開發(fā)者可以為各種經(jīng)典游戲制作mod添加RTX光追效果。
基于該工具,mod制作者需要將游戲?qū)險SD中,然后使用modding工具來創(chuàng)建光線追蹤mod,并導(dǎo)出至RTX渲染器。該工具還使用AI技術(shù),以提升mod材質(zhì)的質(zhì)感。
英偉達在幾年前就已經(jīng)創(chuàng)建了名為Onmiverse的元宇宙創(chuàng)意平臺,讓元宇宙開發(fā)者可以通過這個3D平臺互相連接并共同協(xié)作。
無論是RTX 40系列顯卡更強的GPU算力,還是更真實的光追效果,都無疑將會為元宇宙的生態(tài)貢獻更強的力量。
在老黃演講的開頭,是一段RacerX演示的demo。RacerX是基于Omniverse構(gòu)建的全交互式仿真演示,其中所有的基于現(xiàn)實物理規(guī)律,所有光照、反射和折射則采用光線追蹤技術(shù)。
這也許昭示著英偉達眼中的未來:在更加強大的顯卡性能與AI能力加持下的更加真實的游戲體驗和元宇宙場景。(作者:姚勇喆)
關(guān)鍵詞: NVIDIA全新RTX40顯卡發(fā)布 價格猛漲創(chuàng)新高 計算機程序員 英偉達CEO黃仁勛