Pagsusuri ng Nvidia GeForce RTX 4070: Dumating ang Mainstream Ada

Hands-On: Cooler Master HAF 700 Berserker

Ipinoposisyon ng Nvidia ang bago nitong GeForce RTX 4070 bilang isang mahusay na pag-upgrade para sa mga gumagamit ng GTX 1070 at RTX 2070, ngunit hindi nito itinatago ang katotohanan na sa maraming kaso, epektibo itong nakatali sa RTX 3080 ng huling henerasyon. Ang $599 MSRP ay nangangahulugan na pinapalitan din nito ang RTX 3070 Ti, na may 50% na higit pang VRAM at kapansin-pansing pinahusay na kahusayan. Ang RTX 4070 ba ay isa sa mga pinakamahusay na graphics card? Ito ay tiyak na isang mas madaling rekomendasyon kaysa sa mga card na nagkakahalaga ng $1,000 o higit pa, ngunit hindi mo maiiwasang ipagpalit ang pagganap para sa mga naka-save na pennies.

Sa kaibuturan nito, ang RTX 4070 ay humiram nang husto mula sa RTX 4070 Ti. Parehong gumagamit ng AD104 GPU, at parehong nagtatampok ng 192-bit na memory interface na may 12GB ng GDDR6X 12Gbps VRAM. Ang pangunahing pagkakaiba, maliban sa $200 na pagbawas sa presyo, ay ang RTX 4070 ay mayroong 5,888 CUDA core kumpara sa 7,680 sa 4070 Ti. Ang mga bilis ng orasan ay medyo mas mababa din sa teorya, kahit na mas papasok kami sa aming pagsubok. Sa huli, tinitingnan namin ang isang 25% na pagbawas sa presyo upang sumama sa 23% na pagbawas sa mga core ng processor.

Nasaklaw na namin ang arkitektura ng Ada Lovelace ng Nvidia, kaya magsimula doon kung gusto mong malaman ang higit pa tungkol sa kung ano ang dahilan kung bakit ang mga RTX 40-series na GPU ay tumatak. Ang pangunahing tanong dito ay kung paano nag-stack up ang RTX 4070 laban sa mas mahal nitong mga kapatid, hindi pa banggitin ang nakaraang henerasyong RTX 30-series. Narito ang mga opisyal na detalye para sa reference card.

Swipe to scroll horizontallyNvidia RTX 4070 Compared to Other Ada / Ampere GPUsGraphics CardRTX 4070RTX 4080RTX 4070 TiRTX 3080 TiRTX 3080RTX 3070 TiRTX 3070ArchitectureAD104AD103AD104GA102GA102GA104GA104Process TechnologyTSMC 4NTSMC 4NTSMC 4NSamsung 8NSamsung 8NSamsung 8NSamsung 8NTransistors (Billion)3245.935.828.328.317.417.4Die size (mm^2)294.5378. 6294.5628.4628.4392.5392.5SMs46766080684846GPU Cores (Shaders)58889728768010240870461445888Tensor Cores184304240320272192184Ray Tracing “Cores”46766080684846Boost Clock (MHz)2475250526101665171017651725VRAM Speed ​​(Gbps)2122.42119191914VRAM (GB)121612121088VRAM Bus Width192256192384320256256L2 Cache (MiB)3664486544ROPs6411280112969696TMUs184304240320272192184TFLOPS FP32 (Boost)29.148.740.134.129.821.720.3 TFLOPS FP16 (FP8)233 (466)390 (780)321 (641)136 (273)119 (238)87 (174)81 (163)Bandwidth (GBps)504717504912760608448TGP (watts)200320285350320290220Launch DateApr 2023Nov 2022Jan 2023Jun 2021Sep 2020Jun 2021Oct 2020Launch Presyo$599$1,199$799$1,199$699$599$499

Mayroong isang medyo matarik na dalisdis mula sa RTX 4080 hanggang sa 4070 Ti, at mula doon sa RTX 4070. Tinitingnan namin ngayon ang parehong bilang ng mga GPU shader — 5888 — gaya ng ginamit ni Nvidia sa nakaraang henerasyong RTX 3070. Siyempre , marami pang pagbabago ang naganap.

Ang pangunahin sa mga iyon ay ang napakalaking pagtaas sa mga core clock ng GPU. Ang 5888 shader na tumatakbo sa 2.5GHz ay ​​maghahatid ng mas maraming performance kaysa sa parehong bilang ng mga shader na na-clock sa 1.7GHz — halos 50% na mas maraming performance, ayon sa matematika. Gusto rin ni Nvidia na maging konserbatibo, at ang mga real-world na orasan sa paglalaro ay mas malapit sa 2.7GHz… kahit na ang RTX 3070 ay mas malapit din sa 1.9GHz sa aming pagsubok.

Ang memory bandwidth ay nagiging bahagyang mas mataas kaysa sa 3070, ngunit ang makabuluhang mas malaking L2 cache ay hindi maiiwasang nangangahulugan na ito ay gumaganap nang mas mahusay kaysa sa iminumungkahi ng hilaw na bandwidth. Ang paglipat sa isang 192-bit na interface sa halip na ang 256-bit na interface sa GA104 ay nagpapakita ng ilang kawili-wiling mga kompromiso, ngunit kami ay natutuwa na magkaroon man lang ng 12GB ng VRAM ngayong round — ang 3060 Ti, 3070, at 3070 Ti na may 8GB ay lahat ng pakiramdam ay medyo limitado sa mga araw na ito. Ngunit kapos sa paggamit ng mga memory chip sa “clamshell” mode (dalawang chips bawat channel, sa magkabilang panig ng circuit board), ang 12GB ay kumakatawan sa maximum para sa isang 192-bit na interface sa ngayon.

Habang ang AMD ay naghagis ng lilim kahapon tungkol sa kakulangan ng VRAM sa RTX 4070, mahalagang tandaan na ang AMD ay hindi pa nagbubunyag ng sarili nitong “mainstream” na 7000-series na mga bahagi, at haharapin nito ang mga katulad na potensyal na kompromiso. Ang 256-bit na interface ay nagbibigay-daan para sa 16GB ng VRAM, ngunit pinapataas din nito ang mga gastos sa board at component. Marahil ay makakakuha tayo ng 16GB RX 7800 XT, ngunit ang RX 7700 XT ay malamang na mapupunta rin sa 12GB VRAM. Tulad ng para sa mga nakaraang henerasyong AMD GPU na may mas maraming VRAM, tiyak na totoo iyon, ngunit ang kapasidad ay bahagi lamang ng equation, kaya kailangan nating makita kung paano na-stack up ang RTX 4070 bago magdeklara ng isang panalo.

Ang isa pang kapansin-pansing item ay ang 200W TGP (Total Graphics Power), at masigasig na bigyang-diin ni Nvidia na sa maraming kaso, ang RTX 4070 ay gagamit ng mas kaunting kapangyarihan kaysa sa TGP, kung saan ang mga nakikipagkumpitensya na card (at mga nakaraang henerasyong alok) ay karaniwang tumama o lumampas sa TGP. Maaari naming kumpirmahin na totoo iyon dito, at pag-uusapan natin ang mga detalye sa ibang pagkakataon.

Ang magandang balita ay sa wakas ay mayroon na kaming pinakabagong henerasyong graphics card na nagsisimula sa $599. Natural na magkakaroon ng mga third-party na overclocked na card na magpapalaki ng presyo, na may mga extra tulad ng RGB lighting at beefier cooling, ngunit pinaghigpitan ng Nvidia ang pre-launch review na ito sa mga card na nagbebenta sa MSRP. Mayroon din kaming PNY na modelo na titingnan namin nang mas detalyado sa isang hiwalay na pagsusuri, kahit na isasama namin ang mga resulta ng pagganap sa aming mga chart. (Spoiler: Ito ay kasing bilis ng Founders Edition.)

Larawan 1 ng 2

Nvidia GeForce RTX 4070 block diagramApat na GPC, isang NVENC, at isang NVDEC para sa RTX 4070 (Image credit: Tom’s Hardware)Nvidia GeForce RTX 4070 TiKasama sa buong pagpapatupad ng AD104 ang limang GPC, apat na unit ng NVDEC, at dalawang bloke ng NVENC. (Kredito ng larawan: Tom’s Hardware)

Sa itaas ay ang mga block diagram para sa RTX 4070 at para sa buong AD104, at makikita mo ang lahat ng karagdagang bagay na kasama ngunit naka-off sa mas mababang antas ng pagpapatupad ng AD104. Wala sa mga bloke sa larawang iyon ang “sa sukat,” at ang Nvidia ay hindi nagbigay ng isang die shot ng AD104, kaya hindi namin maaaring subukang tukuyin kung gaano karaming espasyo ang nakalaan sa iba’t ibang mga piraso at piraso – hanggang sa ibang tao. ginagawa ang maruming trabaho, gayon pa man (sa pagtingin sa iyo, Fritzchens Fritz (nagbubukas sa bagong tab)).

Gaya ng napag-usapan dati, kasama sa AD104 ang 4th generation Tensor cores ng Nvidia, 3rd generation RT cores, bago at pinahusay na NVENC/NVDEC units para sa video encoding at decoding (ngayon ay may suporta sa AV1), at isang mas malakas na Optical Flow Accelerator (OFA). Ang huli ay ginagamit para sa DLSS 3, at habang “theoretically” posible na gawin ang Frame Generation gamit ang Ampere OFA (o gamit ang ilang iba pang alternatibo), sa ngayon ay ang mga RTX 40-series na card lang ang makakapagbigay ng feature na iyon.

Ang mga Tensor core naman ay sumusuporta na ngayon sa FP8 na may sparsity. Hindi malinaw kung gaano ito kapaki-pakinabang sa lahat ng mga workload, ngunit tiyak na ang AI at malalim na pag-aaral ay gumamit ng mas mababang katumpakan na mga format ng numero upang palakasin ang pagganap nang hindi makabuluhang binabago ang kalidad ng mga resulta — hindi bababa sa ilang mga workload. Sa huli ay magdedepende ito sa gawaing ginagawa, at ang pag-uunawa kung ano lang ang gumagamit ng FP8 kumpara sa FP16, kasama ang sparsity, ay maaaring nakakalito. Karaniwan, ito ay isang problema para sa mga developer ng software, ngunit malamang na makakakita tayo ng mga karagdagang tool (tulad ng Stable Diffusion o GPT Text Generation) na nagtatapos sa paggamit ng mga naturang feature.

Ang mga interesado sa pagsasaliksik ng AI ay maaaring makahanap ng iba pang mga dahilan upang pumili ng isang RTX 4070 kaysa sa kumpetisyon nito, at titingnan namin ang pagganap sa ilan sa mga gawaing iyon pati na rin ang paglalaro at mga propesyonal na workload. Ngunit bago ang mga benchmark, tingnan natin ang RTX 4070 Founders Edition.