Sammenligning af energiforbrug i GPU'er og hvilke der sparer mest

  • En GPU's energieffektivitet afhænger af både dens arkitektur og produktionsnode, samt den specifikke strømgrænse, der er fastsat af hver model.
  • Inden for servere og AI tilbyder GPU'er som NVIDIA H100 eller Intel Gaudi 3 brutal ydeevne på bekostning af et enormt strømforbrug med en direkte indvirkning på det globale energiforbrug.
  • Inden for gaming- og hjemme-pc'er skiller modeller som GTX 1650, RTX 4060, RTX 5060 eller RX 7600 sig ud med deres gode ydelse/watt-forhold og moderate strømforsyningskrav.
  • For virkelig at sammenligne strømforbruget er det afgørende at analysere ydeevnen pr. watt i specifikke konfigurationer i stedet for blot at fokusere på GPU'ens mærkenavn.

hvilket GPU-strømforbrugsydelse

Valg af grafikkort i disse dage handler ikke længere kun om, hvor mange FPS det får i dit yndlingsspil. Det betyder mere og mere. hvor meget strøm skal den bruge for at fungere godtDette er vigtigt både på grund af elregningen og den varme, den genererer, samt dens miljøpåvirkning. Og det er her, en god sammenligning af energiforbruget kommer ind i billedet, lige fra beskedne GPU'er til en Ryzen 5 7600 til computerkraftværker til kunstig intelligens.

I de følgende linjer finder du en meget komplet guide, hvor to verdener mødes: på den ene side, lavenergi-, højeffektive GPU'er På den ene side er der GPU'er til gaming og hjemme-pc'er, og på den anden side bæsterne til servere og datacentre, der træner AI-modeller og sluger watt, som om der ikke var nogen morgendag. Ideen er, at du skal forstå, hvad der gør en GPU effektiv, hvordan energieffektiviteten har ændret sig hos AMD og NVIDIA, og hvilke specifikke modeller der i øjeblikket tilbyder det bedste forhold mellem ydelse og watt.

Hvorfor er en GPU's energieffektivitet så vigtig?

Når vi taler om strømforbrug i grafikkort, refererer vi normalt til TGP eller TDP, dvs. den omtrentlige maksimale strøm, som GPU'en kan forbruge Under belastning. Denne værdi påvirker flere ting: strømforsyningens størrelse og kvalitet, mængden af ​​genereret varme, ventilatorernes støj og selvfølgelig elregningen, hvis du bruger udstyret meget.

I praksis kan selv to GPU'er med samme mærkenavn opføre sig meget forskelligt, fordi Producenter sætter forskellige effektgrænser afhængigt af modellen og kølepladens design. Det er ikke ualmindeligt at se for eksempel et mobilt RTX 4050, der kører på 35W, og et andet på 115W; navnet er det samme, men Ydeevnen ændrer sig radikalt med det forbrugsloftDette gør sammenligninger ret komplicerede, hvis wattdataene ikke tages i betragtning.

Bedste GPU-baserede streaming- og optagelsesapps til Windows 11
relateret artikel:
Bedste GPU-baserede streaming- og optagelsesapps til Windows 11

Derudover drives hver GPU af PCI Express-bus og ekstra strømstik med 6, 8 eller 16 ben, hvilket fremtvinger et afbalanceret arkitektonisk design med et klart mål: at opnå mere ydeevne, samtidig med at strømforbruget opretholdes eller reduceres ved konfigurere ydeevneprofilerI de senere år har der været store fremskridt på dette område, både inden for spil og inden for servere med GPU'er til AI og HPC (højtydende databehandling).

Udviklingen af ​​energieffektivitet i AMD- og NVIDIA-gaming-GPU'er

Hvis vi ser ti år tilbage, finder vi generationer som ATI Radeon HD 5000 (Terascale 2) og NVIDIA GTX 400Dengang var ydeevnen pr. watt meget tilbage at ønske i forhold til, hvad vi har i dag. Siden da har hver ny arkitektur strammet skruerne på energieffektiviteten.

Et af de mest slående spring kom med NVIDIA GTX 900Det var den første generation af NVIDIA GPU'er, der tydeligt anvendte avancerede flisebaserede rasteriseringsteknikker, hvilket hjalp med at udnytte strømforbruget meget bedre. AMD lovede noget lignende med sin DSBR-teknologi i Vega GPU'er, men en virkelig robust implementering kom først i 2000'erne. første RDNA (RX 5000) og dets udvikling RDNA 2 (RX 6000)hvor balancen mellem ydelse/forbrug forbedredes betydeligt.

Med hensyn til ydeevne pr. watt har AMDs indsats med RDNA været så betydelig, at i visse produktserier, De har formået at positionere sig over NVIDIA RTX 30Dertil skal vi tilføje prisfaktoren: traditionelt har AMD-kort været noget billigere end deres NVIDIA-ækvivalenter, hvilket gør dem attraktive for mange brugere, selvom den lavere pris også afspejlede, at AMD var noget bagud rent ydeevnemæssigt i flere generationer..

Et andet vigtigt aspekt har været produktionsnoden. Mens AMD satsede på TSMCs 7nm i sine seneste generationerNVIDIAs teknologi spændte fra TSMCs 12nm-proces (RTX 20-serien) til Samsungs 8nm-proces (RTX 30-serien). Dette har givet AMD en fordel i transistortæthed og effektivitet, som ikke altid er tydelig, når man kun ser på de tekniske specifikationer. Brugen af ​​en mere avanceret node giver mulighed for... få plads til flere transistorer på mindre plads og forbruge mindre strøm med samme ydeevne, så sammenligningen mellem arkitekturerne har ikke været helt retfærdig.

Med ankomsten af ​​nye generationer forventes både AMD og NVIDIA at anvende mere avancerede noder (såsom TSMC's 5nm-proces i nyere arkitekturer), hvilket Det vil udjævne spillefeltet meget mere. og det vil give os mulighed for at sammenligne effektivitet på næsten lige vilkår, hvilket gør kvaliteten af ​​rent arkitektonisk design tydeligere.

GPU'er til servere og AI: ekstrem strøm og ublu forbrug

GPU-strømforbrug

Den anden store front, hvor kampen om effektivitet udkæmpes, er den, der GPU'er til servere og datacentreMålet her er ikke at opnå høj FPS i spil, men snarere at accelerere kunstig intelligens-modeller, big data og ekstremt komplekse videnskabelige simuleringer. Og selvom effektivitet er en prioritet, stiger det absolutte strømforbrug til svimlende tal.

NVIDIA H100: Et AI-bæst, der fortærer watt

La NVIDIA H100 Den er den dag i dag en af ​​de mest kraftfulde GPU'er i NVIDIAs katalog til AI og HPC. Den er baseret på Hopper-arkitekturen og er designet til organisationer, der har brug for exceptionel ydeevne. træne og køre næste generations AI-modeller, store sprogmodeller og komplekse videnskabelige simuleringer.

Blandt dens tekniske funktioner skiller følgende sig ud: 4nm avanceret produktionsteknologi (TSMC)Den er kompatibel med op til 80 GB HBM3-hukommelse og har enorm computerkraft: snesevis af TFLOPS i FP64 og over 1000 TFLOPS ved hjælp af dens Tensor-kerner i en lille formfaktor. Den understøtter også datatyper såsom FP8hvilket muliggør en betydelig forbedring af effektiviteten af ​​træning af store modeller uden at miste for meget nøjagtighed.

Takket være fjerde generations NVLink kan H100 forbindes med andre GPU'er at danne ægte højtydende klynger, der multiplicerer computerkapaciteten. Prisen for alt dette er et overvældende elforbrug: i AI-konfigurationer taler vi om omkring 700 watt pr. GPUFor at sætte det i kontekst, er det mere end mange komplette stationære pc'er forbruger, og mere end adskillige avancerede gaming-grafikkort tilsammen.

Når man ganger forbruget med millioner af enheder, der forventes at blive brugt i de kommende årDet årlige energiforbrug når niveauer, der kan sammenlignes med elforbruget i hele lande. Det anslås, at alene med H100'erne nemt kan overskrides 13.000 GWh om året, hvilket er mere end det samlede forbrug i lande som Guatemala eller Litauen. alvorlige miljø- og energispørgsmål på fremkomsten af ​​AI.

NVIDIA A30: Balancering af ydeevne og strømforbrug til inferens

Foran H100, den NVIDIA A30 Det er en mere afbalanceret server-GPU, baseret på Ampere-arkitekturen. Den er rettet mod virksomheder, der har brug for God ydeevne, men også opmærksom på forbrug og budget.Det er en udbredt mulighed for AI-inferens (ved hjælp af prætrænede modeller), moderat HPC og virtualisering.

A30 er fremstillet ved 7 nm af TSMC og tilbyder op til 10 TFLOPS i FP64 og omkring 165 TFLOPS i Tensor-kernermed 24 GB HBM2-hukommelse og muligheden for at forbinde op til to kort via NVLink. Dens største fordel er, at Den opnår betydelig computerkraft med et forholdsvis lavt strømforbrug.Dette gør det meget attraktivt for datacentre, der søger driftseffektivitet og rimelige elomkostninger.

Intel Gaudi 2: et solidt alternativ til NVIDIA til AI

Intel har gennem Habana Labs udviklet Gaudi acceleratorer som et alternativ til NVIDIA GPU'er til AI-arbejdsbelastninger. Modellen Gaudí 2 Den er specifikt designet til træning af neurale netværk, med 24 Tensor-kerner og et meget klart fokus på at maksimere ydeevne og effektivitet i denne type opgave.

Gaudi 2 er fremstillet ved 7 nm og indeholder 96 GB HBM2e-hukommelse og et åbent softwareøkosystem. Dets største styrke er integrationen af ​​teknologier som RDMA og RoCE, som tillader direkte hukommelsesadgang mellem noder og forbedret skalerbarhed, når flere acceleratorer implementeres parallelt. Selvom dens nøjagtige wattforbrug ikke diskuteres så meget som i tilfældet med H100, er dens design rettet mod at tilbyde et meget konkurrencedygtigt forhold mellem ydelse og forbrug.

Intel Gaudi 3: Mere ydeevne og bedre effektivitet i stor skala

El Intel Gaudi 3 Det er den naturlige udvikling af Gaudi 2 og repræsenterer et betydeligt spring i ydeevne og skalerbarhed for generativ AI, udvidede sprogmodeller (LLM) og billedbehandling. Med en 5nm-node og en arkitektur optimeret til FP8 kan den opnå op til 1,835 PFLOPS i det formatog håndterer op til 120 GB HBM2e-hukommelse.

Dens forbedrede sammenkoblingsinfrastruktur muliggør opbyg store klynger mere effektivtDette er afgørende, når man træner gigantiske modeller. I sammenlignende LLM-træningstests kan Gaudi 3 være op til 1,7 gange hurtigere end veletablerede alternativer, hvilket svarer til mindre computertid og bedre energieffektivitet nødvendigt for at opnå et vist præstationsniveau.

Miljøpåvirkning og behovet for renere energi

Væksten i brugen af ​​GPU'er til AI og datacentre har ført til energiforbruget i disse infrastrukturer stiger voldsomtDet handler ikke kun om den effekt, der kræves af acceleratorer som H100 eller Gaudi 3, men også resten af ​​den understøttende hardware og frem for alt de kølesystemer, der er nødvendige for at holde dem inden for deres termiske grænser.

Store teknologivirksomheder som Meta, OpenAI og lignende har allerede indrømmet, at de for at fodre deres AI-infrastruktur enorme mængder energi er nødvendige...til det punkt, hvor man åbent diskuterer dedikerede atomkraftværker eller massive investeringer i vedvarende energi. Dette har rejst alvorlig bekymring over klimapåvirkningen af ​​AI-udvikling, især da mange af disse applikationer når slutbrugerne som tilsyneladende gratis tjenester.

I betragtning af dette scenarie bliver det afgørende, at Virksomheder, der designer GPU'er, bør forbedre både effektiviteten og energikilden, der driver dem.Det er nytteløst, at en GPU er 20 % mere effektiv, hvis det samlede antal acceleratorer, der anvendes, tidobles, og der fortsat anvendes fossile brændstoffer. Her ophører sammenligningen af ​​forbrug og effektivitet med blot at være et spørgsmål om elregninger og bliver et spørgsmål om miljøansvar.

Lavenergi grafikkort til hjemme-pc'er og spil

Inden for hjemme-pc'er og spil er billedet anderledes. For mange brugere betyder det at have en effektiv GPU Spar på strømforsyningen, reducer varmen i kabinettet og undgå overdreven støj...udover at betale lidt mindre i slutningen af ​​måneden. GPU'er med lavt strømforbrug er fortsat en meget interessant kategori, især i mellemklassen og... Spiloptimering og -styring på Steam.

En GPU anses generelt for at være lavenergi, hvis den Den overstiger ikke omkring 150W under reel belastningOg i værste fald behøver den kun et enkelt 8-bens stik eller slet intet, og trækker udelukkende strøm fra PCI Express-stikket. Dette gør det muligt for den at fungere fejlfrit i systemer med strømforsyninger på 300 til 400 W, perfekt til byg budget-pc'er eller opgrader gamle maskiner uden at skulle skifte halvdelen af ​​platformen.

Sådan undervolter du moderne CPU'er
relateret artikel:
CPU- og GPU-diagnostik med CPU-Z / GPU-Z / HWiNFO

Hvad tilfører en strømbesparende GPU til en rigtig pc?

Et typisk eksempel ville være en pc med en Ryzen 5 5600X, 16 GB DDR4 RAM, en PCIe SSD og en 240 mm AIO-kølerHvis du installerer en effektiv GPU som en RTX 4060 eller en fremtidig RTX 5060 i det system, ligger systemets samlede strømforbrug under belastning typisk mellem 280 og 320 W, hvilket giver en 400 W strømforsyning mere end rigelig plads. Derudover er en ordentlig ydeevneoptimering i Windows 11 Det hjælper med at holde disse forbrugsniveauer under kontrol.

Disse grafikkort har desuden De kræver ikke topmoderne CPU'er for at yde godt.Derfor kan de parres med relativt billige processorer uden frygt for en alvorlig flaskehals. De er også typisk kompakte og nemme at køle, med blæsere, der ikke behøver at dreje med maksimal hastighed, hvilket betyder køligere og mere støjsvagt udstyr.

Specifikke modeller af effektive GPU'er og deres strømforbrug

GeForce GTX 1650 GDDR6: en meget økonomisk og sparsommelig mulighed

La GeForce GTX 1650 med GDDR6-hukommelse Det er en af ​​de bedste muligheder, hvis du leder efter en meget billig brugt model til at genoplive en ældre pc. Den har en TGP på kun 75W og drives af udelukkende fra PCI Express-porten i mange versioner og kan fungere uden problemer med ældre 300W strømforsyninger.

Med hensyn til ydeevne yder denne GPU på samme måde som en GeForce GTX 970 eller et Radeon RX 570Den har dog den fordel, at den bruger en mere moderne arkitektur (Turing) og har understøttelse af opdaterede drivere. Den er stadig i stand til at køre mindre krævende eller ældre spil i 1080p med acceptabel kvalitet, hvilket gør den meget interessant for systemer, der kun har brug for et beskedent grafikboost.

GeForce RTX 4060: Fantastisk effektivitet til 1080p

La NVIDIA GeForce RTX 4060 Det er et højt anset kort, værdsat for sin balance mellem ydeevne og strømforbrug. Baseret på Ada Lovelace-arkitekturen (AD107-kerne) tilbyder det mere end nok kraft til afspil i 1080p med høj eller meget høj kvalitet i nuværende titler, med understøttelse af teknologier som DLSS.

Hans TGP handler om 115 W og bruger et enkelt 8-bens stikDerfor fungerer den fantastisk med 350-400W strømforsyninger, forudsat at resten af ​​systemet ikke er for strømkrævende. Den leveres med 3.072 shaders, 8 GB GDDR6 ved 17 Gbps, en 128-bit bus og et godt antal Tensor- og RT-kerner. Prisen er normalt under €300, hvilket i betragtning af strømforbruget og den spiloplevelse, den tilbyder, gør den til en god mulighed. et af de mest effektive grafikkort, som NVIDIA har udgivet i de senere år.

GeForce RTX 5060: Ydelsesspring med lavt strømforbrug

La GeForce RTX 5060 Den tager et yderligere skridt i ydeevne ved at inkorporere Blackwell-arkitekturen (GB206-kerne) og meget hurtig GDDR7-hukommelse. Den øger antallet af shaders til 3.840 og forbedrer ydeevnen sammenlignet med RTX 4060, hvilket placerer den i praksis. på niveau med en 8GB RTX 4060 Ti i rå kraft.

Hans TGP stiger til 145 WDen holder sig stadig inden for, hvad der kan betragtes som moderat strømforbrug. Den kræver et 8-bens stik, og med en typisk konfiguration af en Ryzen 5 5600X, 16 GB RAM og en SSD, bør det samlede system ikke overstige 320 W under belastning. Dens 8 GB GDDR7 og understøttelse af næste generations frame-genereringsteknikker giver den... Lang levetid ved 1080p og input op til 1440puden at forbruget stiger voldsomt.

AMD Radeon RX 7600: et effektivt alternativ til RTX 4060

For dem der foretrækker AMD, Radeon RX 7600 Det er en interessant konkurrent i mellemklassen. Baseret på RDNA 3 (Navi 33) har den 2.048 shaders, 8 GB GDDR6 ved 18 Gbps og en 128-bit bus, samt 32 dedikerede ray tracing-enheder. Med hensyn til ydeevne, Den præsterer meget tæt på RTX 4060 ved 1080p, hvilket gør det til en god mulighed for den opløsning.

Hans TGP handler om 165 W og kræver et 8-bens stikI et standardsystem med en Ryzen 5 5600X og en afbalanceret konfiguration forbliver den fuldt funktionsdygtig med en kvalitets 400W strømforsyning. Hvor den især skinner, er i balance mellem forbrug og ydeevne nu hvor prisen er faldetHvis du finder den for omkring 260 euro eller mindre, er det normalt et ret fornuftigt køb.

GeForce RTX 5060 Ti 16 GB: Høj effekt uden uoverskueligt forbrug

Går vi et trin op, finder vi GeForce RTX 5060 Ti 16GBDette kort nærmer sig high-end ydeevne, samtidig med at det opretholder et rimeligt strømforbrug. Med Blackwell-arkitektur og en GB206-kerne tilbyder det 4.608 shaders, 16 GB GDDR7 ved 28 Gbps, en 128-bit bus og et godt antal Tensor- og RT-kerner.

Hans TGP er omkring 180 WOg alligevel formår den stadig at overgå et Radeon RX 7700 XT, som har en TGP på 245W. Den behøver kun ét 8-bens stik, hvilket forenkler installationen betydeligt. I en pc med Ryzen 5 7600, 32 GB DDR5, NVMe SSD og en 240 mm kølerDet samlede strømforbrug er omkring 360 W under belastning med denne GPU. Ideelt set bør du i dette tilfælde vælge... 450-500W strømforsyninger af god kvalitet at have masser af plads og holde kilden i dens maksimale effektivitetszone.

GeForce RTX 4070: den øvre grænse for "rimeligt strømforbrug"

Endelig en model, der grænser til, hvad nogle ikke længere ville anse for at have lavt strømforbrug, men som stadig er ret beskeden sammenlignet med topkort: GeForce RTX 4070Med Ada Lovelace-arkitektur (AD104), 5.888 shaders, 12 GB GDDR6 ved 21 Gbps og en 192-bit bus er det en GPU designet til Spil i 1440p med alt maks. og endda tage et kig på 4K.

Hans TGP handler om 200 Wog kræver typisk to 8-bens stik eller et 16-bens stik, afhængigt af modellen. I en typisk konfiguration med en Ryzen 5 7600, 32 GB DDR5 RAM og væskekøling bruger hele systemet omkring 380-390 W under belastning. Til denne kombination anbefales følgende: en god strømforsyning på 500-600Whvilket giver mulighed for margin og sikrer høj effektivitet af selve strømforsyningen.

Sammenligninger baseret på forbrug i den virkelige verden: den store udfordring

Et tilbagevendende problem, når man sammenligner GPU'er, er, at de fleste hjemmesider fokuserer på gruppebenchmarkresultater efter modelDette gøres uden at tage den nøjagtige effekt for hver version i betragtning, især i bærbare computere. Dette fører til misvisende sammenligninger, hvor for eksempel et mobilt RTX 3050 Ti med en kapacitet på 35W fremstår blandet med andre varianter på 60 eller 80W, hvilket forvrænger opfattelsen af ​​dets faktiske effektivitet.

Ideelt set bør man, når man sammenligner energiforbrug, kunne vælge ikke kun GPU-modellen, men også dens specifikke effektgrænse (for eksempel RTX 3050 Ti ved 35W versus RTX 4050 ved 45W) og se den relative ydeevne i hvert tilfælde. Selvom der findes databaser og lister, der rangerer GPU'er efter watt, for både stationære og bærbare computere, De integrerer ikke altid de ydeevneresultater, der er forbundet med hver effektkonfiguration.hvilket virkelig giver os mulighed for at evaluere effektiviteten.

Desuden skal det huskes Det samme silicium kan opføre sig meget forskelligt afhængigt af producentens design. (VRM, køling, strømbegrænsninger), især i bærbare computere, hvor en lavstrømsvariant sigter mod at forlænge batterilevetiden og reducere varme, mens en variant med højere effekt prioriterer rå ydeevne. Derfor er det ikke nok blot at se på de tekniske specifikationer, når man analyserer strømforbruget: Det er vigtigt at overveje belastningstestene og de nøjagtige forhold for hver model og lav en dybdegående systemrengøring før måling.

Hele billedet, fra sparsommelige GPU'er som et GTX 1650 GDDR6 til monstre som NVIDIA H100 eller Intel Gaudi 3, viser, at energieffektivitet er blevet et centralt fokuspunkt i design og valg af grafikkort.

Hvordan ved jeg, om jeg har en dedikeret GPU eller iGPU i Windows 11
relateret artikel:
Hvordan ved jeg, om jeg har en dedikeret GPU eller iGPU i Windows 11

En forståelse af, hvordan forbrug, arkitektur, produktionsnode, ydeevne og specifik use case mødes, giver mulighed for langt mere fornuftige beslutninger, uanset om det drejer sig om at bygge en overkommelig gaming-pc med et godt ydeevne/watt-forhold eller dimensionere en AI-klynge, der ikke forvandler elregningen til et permanent chok. Del disse oplysninger, så flere kan lære om emnet.