Nvidia GeForce GTX 980 und GTX 970: Maxwell mit maximaler Power?

Maxwell tauchte vor vielen Monaten erstmals in Form der GM107-basierten Midrange-Karten der GTX 750-Familie auf. Nun zeigt Nvidia mit der GM204-basierten GeForce GTX 980 und GTX 970, wo der Hammer hängt. Wir haben viel erwartet - und noch mehr bekommen.

Vor rund sieben Monaten stellte Nvidia seine neue Grafikarchitektur mit dem Codenamen "Maxwell" in Form der GeForce GTX 750 und 750 Ti vor. Diese Karten definierten die Grenzen der Grafikperformance von Gaming-PCs zwar nicht neu, sorgten aber für eine bis dato unerhörte Effizienz. Die Maxwell-basierte GeForce GTX 750 Ti ist ein Paradebeispiel für hohe Performance pro Watt und erzielt Framerates auf dem Niveau von Grafikkarten mit dem Doppelten seiner TDP von 65 Watt.

Eine derart hohe Effizienz ist wundervoll – und Nvidias Ansatz, sich künftig zuerst auf die Verbesserung der Leistungsaufnahme seiner mobilen SoCs (wie zum Beispiel den Tegra K1) zu konzentrieren, die dann von den Desktop-GPU-Architekturen übernommen werden, lässt auf noch mehr Energieeffizienz hoffen.

Dennoch ist Energieeffizienz in der Regel nicht die Kenngröße, die das Herz eines PC-Enthusiasten schneller schlagen lässt. Daher haben wir uns natürlich seit Tag eins eine hochperformante Version von Nvidias Maxwell-Architektur gewünscht. Die gute Nachricht: Genau diesen Wunsch hat das Unternehmen mit der heutigen Markteinführung der GeForce GTX 970 und GTX 980 erfüllt.

Auf den ersten Blick erinnert die GM204-GPU der GeForce GTX 970 und 980 an eine entsprechend hochskalierte Version der GM107 der GeForce GTX 750 Ti. Wie die GM107 hat sie vier Blöcke je Streaming-Multiprozessor (SMM) und jeder SMM beherbergt 128 CUDA-Kerne, 32 Load/Store-Units, acht Textureinheiten und eine einzelne Polymorph-Engine. Der ganzen GPU stehen zwei Megabyte gemeinsam genutzter L2-Cache zur Verfügung.

Der offensichtliche Unterschied ist die Anzahl der SMMs: Wo die GM107 deren fünf hat, verfügt die GM204 in der GeForce GTX 980 über satt 16 Stück. Das summiert sich zu 2048 CUDA-Kernen, 512 Load/Store-Units, 128 Textureinheiten und 16 Polymorph-Engines beim Top-Modell GeForce GTX 980 auf. Bei der "kleinen" GeForce GTX 970 sind es immer noch 13 SMMs, was in 1664 CUDA-Kernen, 416 Load/Store-Units, 104 Textureinheiten und 13 Polymorph-Engines resultiert.

Trotz ihrer Ähnlichkeiten profitiert die GM204 im Vergleich zu GM107 von etlichen Upgrades. Beispielsweise hat jeder SMM bei der GTX 980 Zugriff auf einen 96 Kilobyte großen Adressbereich für GPU-Rechenaufgaben; bei der GTX 750 Ti waren es noch 64 Kilobyte. Der L1-/Textur-Cache ist bei der neuen GPU 24 Kilobyte je zwei CUDA-Kerne groß (also 48 Kilobyte pro SMM), was die Ressourcen im Vergleich zur GM107 effektiv verdoppelt.

Im Gegensatz zur GM107 verfügt die GM204-GPU anstelle eines einzelnen GPCs (Graphics Processor Clusters) über deren vier; sie profitiert also von der vierfachen Anzahl an Raster-Engines. Natürlich brauchen High-End-Grafikkarten auch ein leistungsfähigeres Back-End, um mit all dem Datendurchsatz klarzukommen. Daher verfügt die GTX 980 über vier Render-Back-Ends, die für jeweils 16 Vollfarb-ROP-Operationen je Takt durchführen können, also 64 insgesamt. Dazu kommen noch vier 64-Bit-Speicher-Controller, was sich zu einem aggregierten256 Bit breiten Speicher-Bus aufsummiert.

Schauen wir uns mal die Taktraten an: Die GeForce GTX 980 hat einen Basistakt von 1126 MHz und einen Boost-Takt von 1216 MHz, während die Taktraten der GeForce GTX 970 bei 1050 MHz respektive 1178 MHz liegen. Beide Grafikkarten verfügen über vier Gigabyte RAM, der mit 1750 MHz taktet. Das entspricht einer effektiven GDDR5-Rate von sieben Gigahertz, was wiederum auf eine Speicherbandbreite von 224 GByte/s hinausläuft. Aber schauen wir uns mal Nvidias aktuelle High-End-Palette an um zu sehen, wie gut sich die neuen Maxwell-basierten Karten auf dem Papier schlagen:

Hinsichtlich der Platzierung am Markt macht es aber mehr Sinn, die GM204 mit der Kepler-basierten GK110  der GeForce GTX 780 Ti zu vergleichen. Diese Karte hat 2880 CUDA-Kerne, 240 Textureinheiten, 48 ROPs und einen aggregierten Speicher-Bus von 384 Bit, was in einer Speicherbandbreite von 336 GByte/s resultiert. Jedes dieser Attribute (abgesehen von ROPs/Takt) liegt über den Spezifikationen der neuen GeForce GTX 980. Aber Maxwell ist ja eine sehr effiziente Architektur, die mit weniger mehr leisten soll.

Wer sich noch mal ein bisschen in der Theorie einlesen will, sollte sich unseren Launch-Artikel Nvidia GeForce GTX 750 Ti: Maxwell ist da - mehr Power, weniger Durst zu Gemüte führen.

Wir erwarten jedenfalls, dass die GeForce GTX 980 gegen die GTX 780 Ti antritt und sie eventuell sogar schlägt. Die GeForce GTX 980 scheint beim Raster-Processing besonders stark zu sein und kann hier mit 64 Vollfarb-ROPs pro Takt und einer Füllrate von 72 Gpixel/Sekunde punkten. Zum Vergleich: die GTX 780 Ti hat 48 ROPs pro Takt und eine Füllrate von 44 Gpixel/Sekunde. Dies sollte der GM204 bei hohen Auflösungen und Anti-Aliasing einen Vorteil verschaffen – und den wird sie auch brauchen, wenn es um Gaming mit 4K-Auflösung geht.

Unabhängig von der verbesserten Effizienz der GU-Architektur der GeForce GTX 980 reden wir hier immer noch über ein Drittel weniger Speicherbandbreite im Vergleich zu GeForce GTX 780 Ti. Nvidia versucht dieses Defizit mit einer verbesserten Speicherkompression ausgleichen, denn die GM204 verfügt über einen verbesserten Delta-Color-Compression-Modus der dritten Generation, der der Hardware mehr Möglichkeiten eröffnet.

Bei Nutzung von 8x8-Blöcken von 64 Pixeln wird die Kompressionsanalyse an 2x4-Blöcken durchgeführt, um die beste Kompression in 8:1-, 4:1- und 2:1-Schritten zu erzielen. Wenn 2:1-Kompression nicht möglich ist, wird der betreffende Block nicht komprimiert. Alle erfolgreich komprimierten Blöcke sparen jedes Mal Bandbreite ein, wenn der Speicher gelesen wird.

Laut Nvidia soll diese Verbesserung die effektive Speicherbandbreite im Vergleich zu den Kepler-basierten GTX-680-Karten von 224 GByte/s auf etwa 300 GByte/s steigern. Wir werden noch sehen, ob das genug ist, damit die GeForce GTX 980 sich gegen die formidable GeForce GTX 780 Ti durchsetzen kann.

An dieser Stelle sollte man noch kurz über die die verbesserte Tessellation-Performance der GM204 reden. Das Design von Nvidias Polymorph Engine 2.0 kam bei Kepler und sogar der Maxwell-basierten GM107 zum Einsatz, aber die GM204 setzt auf die verbesserte Polymorph Engine 3.0. Laut Nvidia sollen dank architektonischer Verbesserungen pro Engine bis zu 50 Prozent mehr Leistung bei hohen Tessellation-Faktoren drin sein.

Nvidias neue GPU bietet zudem einige einzigartige Display-Optionen. Die GeForce-Modelle GTX 980 und GTX 970 sind die weltweit ersten Grafikarten, die den HDMI-2.0-Standard unterstützen. Das bedeutet volle 4K-Unterstützung mit 60 Hz; bei HDMI 1.2 waren es nur 30 Hz. Das Design der Referenzkarte beinhaltet drei DisplayPort-1.2-Ausgänge sowie einen DVI-Anschluss (Dual-Link). Die GPU kann bis zu vier 4K-Displays gleichzeitig befeuern und verfügt über eine Display-Engine, die Auflösungen bis zu 5K unterstützt.

Nvidia hat außerdem die GPUs der GM2xx-Generation mit einem verbesserten Video-Decoder bestückt, der nun H.265-Encoding (HEVC) unterstützt. Dies ist ein nettes, zukunftssicheres Feature, da es bisher noch keine Software gib, die die Vorteile von H.265 wirklich nutzt. Bezüglich des aktuellen H.264-Standards sollte man im Hinterkopf behalten, dass die Maxwell-basierte GM107-GPU in der GeForce GTX 750-Serie bereits verbessert wurde und im Vergleich zur Kepler-Generation den zweieinhalbfachen Durchsatz bieten soll.

Das wären die wichtigsten Änderungen aus der Architektur-Perspektive. Nvidia hat natürlich nicht verlauten lassen, ob die GM204 der GeForce GTX 980 beschnitten ist oder nicht. Es ist also sehr gut möglich, dass wir diese GPU noch mit mehr (oder weniger) CUDA-Kernen in einem anderen, künftigen Produkt wieder zu Gesicht bekommen.

Da wir die Änderungen an der Hardware damit abgehandelt haben, können wir uns jetzt den neuen Features der GeForce GTX 970 GeForce GTX 980 und den potenziellen Vorteilen widmen, die Gamern daraus erwachsen.

Erstelle einen neuen Thread im Artikel-Forum über dieses Thema
Dieser Thread ist für Kommentare geschlossen
60 Kommentare
    Dein Kommentar
  • Ich möchte, da ich den Test schon auf der Amiseite gelesen hatte, den dort 1. Kommentator zitieren: Wow. Ohne Ausrufezeichen, weil ich die Leistungsaufnahmeproblematik unter GPGPU-Volllast sehr ärgerlich finde.
    0
  • Vielen Dank für den Test. Ich glaub es gibt einen Fehler in der Gesamtübersicht Leistungsaufnahme Gaming:
    die GTX980 zieht in der Detailbetrachtung 185W und keine 200W. Oder?
    0
  • Vielen Dank für den Test. Ich glaub es gibt einen Fehler in der Gesamtübersicht Leistungsaufnahme Gaming:
    die GTX980 zieht in der Detailbetrachtung 185W und keine 200W. Oder?
    0
  • hmpf, wo kann ich meine 290X gegen eine 970 eintauschen? ;)
    0
  • Die 320€ für eine GTX 970 kann ich mir beim besten Willen nicht vorstellen. NVidia ist nicht gerade dafür bekannt, eine gleichwertige karte (r9 290x) 60€ billiger anzubieten als die Konkurrenz. Wenn die wirklich so kommt, werden die AMD Preise purzeln: R9 290 dann für 260€ und 280x für 199€?
    0
  • Die GTX 970 ist so gut wie gekauft :)
    0
  • Vielen Dank für den tollen Test.
    Ich habe mich schon den halben Tag gewundert, warum auf anderen Seiten bereits die neuen Artikel veröffentlicht wurden, während die Seite mit dem liebevollsten Grafikparcours sich brav zurück hält. Aber jetzt ist ja alles da. :-)
    0
  • Weiß jemand was an der Evga ACX 2.0 gegenüber der ACX außer der Stromversorgung anders ist? https://geizhals.de/?cmp=1168341&cmp=1168428#xf_top
    0
  • Jetzt schon ab 309 Euro lieferbar? Cool!
    0
  • Ich schätze einen Straßenpreis von deutlich unter 300 Euro in 2-3 Wochen
    0
  • Meinst du wirklich? Dann muss AMD die Preise aber auch stark senken.
    0
  • Ja, das wird wohl so kommen (müssen)
    0
  • @alterSack66
    Ist ein überarbeiteter Kühler verbaut. Angeblich gab es vom Neuen nicht genug (Produktion), deshalb werden beide Varianten angeboten.
    0
  • So, danke für den schönen Test. Kommen doch die Shots der Infracam? Ich weiß, die Zeit..
    Tatsächlich ist für mich auch die 970 die Karte die ich wählen würde zur Zeit. Allerdings fühle ich mit meiner 7870 (1080p Moni) noch keinen Aufrüstdruck. Vlt. beim Witcher? Mal sehen. Und das ist auch für mich das Problem aller aktuellen Performance / High End Karten zu stark für 1080p und zu schwach für 4k. Angesichts dessen was so in ca. 2 Jahren in Monitormarkt ansteht (Oled 4K) finde ich den kauf eines neuen Monitors auch blöd, und damit auch den Kauf einer GK zur Zeit. Na, kommt Zeit, kommt Rat.
    0
  • Rein vom Gaming könnte man eine GTX 780Ti gegen eine GTX 970 wechseln, aber wenn die Karte unter Vollast rendern darf und keine Möglichkeiten der Lastanpassung zur Stromaufnahme hat, kann auch Maxwell weit mehr verbrauchen als eine GTX 780Ti.

    Wobei ich sehe, das eure GTX 780Ti mit Standardtakt arbeitete, und da zum einen noch viel Luft nach oben ist, und zum anderen könnte das den Maxwell Karten konkurrenz machen.

    Es wäre durchaus interessant die GTX 780Ti, die GTX 970 / GTX 980 und die R9-280X und R9-290X im moderat übertakteten Zustand auf Effizienz zu testen, dann könnte viel Licht ins Dunkel gebracht werden.

    Vor allem im GPGPU Bereich, wo die Maxwell Architektur punkten soll, könnte man noch einen Benchmark durchführen, um zu sehen wie sich die höhere Leistungsaufnahme auf die Geschwindigkeit auswirkt.
    0
  • An die Experten hier: Habe zur Zeit eine GTX660Ti und einen alten Intel Core i5-2400. Mein Netzteil ist ein Be Quiet! Straight Power E9 400Watt (laut PC-Experience Test Leistungsreserven bis 546W!). Ist es OK, wenn ich eine referenzgetaktete GTX 970 dranhänge, oder könnte das Ärger machen? Die TDP ist bei beiden Karten gleich.
    0
  • @jjensson
    Du kannst maximal 10% überlasten solltest das aber nicht darauf hin auslegen.
    Im Prinzip sollte es gehen im schlimmsten Fall schaltet das NT ab. Überlastschutz.
    Empfehlen würde ich es aber nicht, ein paar Watt mehr wären schon gut.
    Sinnvoll ist es nur bedingt da der Prozessor viel zu schwach ist zumindest für viele games.
    0
  • Sorry wegen der Mehrfachpostings - jedesmal, wenn ich Refresh drücke, postet Tom's einen neuen Kommentar. Schlechtes Webdesign?

    Danke, Big-K. Das Netzteil habe ich mir letzten Winter geholt, extra-"schwach" wegen der Effizienz. Nun rächt sich das.

    CPU wahr hier noch nie der Flaschenhals (geht ja bis 3,1/3,4GHz und wirklich deutlich mehr bekommt man ohne übertakten heute sowieso noch nicht von der Intel-Stange).
    0
  • Moin zusammen, ich habe das mit der Lastaufnahme noch nicht ganz kapiert.
    Wenn ich jetzt v.a spielen will (1080p, Ultra Details) die GTX970 also richtig fordere, verbraucht sie dann also doch deutlich mehr als die angegebene TDP von ~165W? (Xeon E3 1231, Corsair CS 550W, 8GB Ram)
    Hintergrund ist einfach nur die Überlegung der Stromkosten wegen: Möchte meine HD6850 (TDP ~140W) upgraden und hatte an eine R9 280x gedacht (TDP~250W), und bei dem doch deutlich niedrigerem TDP der GTX970 hätte ich den Aufpreis von ~ 80€ nach ein paar Jahren wieder raus....dachte ich, aber wie muss ich die Spitzen der Lastaufnahmen denn jetzt interpretieren? Verbraucht die GTX970 dann am Ende doch soviel wie zB eine R9 280x bei hoher Gaming-Auslastung? Sind die 165W TDP also am Ende nur Augenwischerei?
    0
  • Diese Forensoftware, schrecklich.
    Als angekündigt wurde das die 980 nur 16 sm haben wird dachte ich nicht das die so gut abschneidet aber der Takt machts wohl möglich.
    Was mir nur nicht ganz klar ist, wenn powertune schon mit 100 kHz arbeitet wie hochfrequent arbeitet nv boost?
    Da die Leistungsaufnahme in games nur etwa die Hälfte wie im GPGPU beträgt könnte man daraus schließen das die Hälfte der Zeit gar nichts berechnet wird? Vielleicht sollte man mal verschiedenen Spiele einzeln auf ihren Stromverbrauch untersuchen.
    0