Kleine, heiß-kalte Schwester: AMD RX Vega56 mit Effizienztest und VR

Heute ist der eigentliche Launchtag der Radeon RX Vega56, verbunden mit einer versprochenen Marktverfügbarkeit, die es aber abzuwarten gilt. Schließlich reichten ja noch nicht einmal die Samples für alle Redaktionen. Ist die RX Vega56 nun die bessere 64?

Genau das bleibt aber am Ende die spannendste Frage dieses Tages, denn von einer breiten Verfügbarkeit und vor allem stabiler Software war ja bisher kaum etwas zu spüren. Es kann also eigentlich nur besser werden.

Doch was bleibt einem am Schluss übrig, wenn man, aus welchen Gründen auch immer, erst einmal kein Sample erhält, um pünktlich zum vorgezogenen Launchtag mit am Start sein zu können? Wir haben deshalb versucht, mit einem zusätzlichen Abschnitt zur VR-Performance und einer Effizienzbetrachtung wenigstens noch etwas Mehrwert zu generieren, um nicht das 1001. Review von der Stange anzubieten, das eh keinen mehr interessiert.

Gerade der VR-Bereich rund um unsere FCAT-Messungen zeigt jedoch, dass nicht nur AMD offene Baustellen ohne Absicherung betreibt. Wir haben unseren Test nämlich mehrmals verschieben müssen, weil eine FCAT-Bibliothek fehlerhaft war. Zusammen mit Nvidia konnten wir dann exklusiv auch die neueste Software testen und nutzen. Zumindest diese Werte sind also auch exklusiv aktuell nur hier zu lesen und es hat schon einen gewissen Unterhaltungswert, dass sich sogar Nvidia extra bemüht, damit indirekt einen RX Vega56 Artikel noch einigermaßen zeitnah zu gewährleisten.

Wir verweisen an dieser Stelle natürlich auch noch einmal auf unseren Test der Vega Frontier Edition und den Launchartikel zur RX Vega64, die beide dann auch die entsprechenden Informationen zur Technologie und Theorie unter der Haube enthalten. Darüber hinaus hatten wir ja auch schon mit dem Wasserkühlungsumbau ("Übertaktet und abgekocht: AMD Radeon RX Vega64 wassergekühlt") ein weiteres Follow-Up veröffentlicht, das andere Facetten zeigen konnte.

Was unterscheidet die Radeon RX Vega56 von der RX Vega64?

Die Radeon RX Vega 56 nutzt den gleichen Vega-10-Prozessor, wie wir ihn auch in der Vega64 finden. Es ist ein 486 mm² großer Chip mit 12,5 Milliarden Transistoren, der in GlobalFoundries 14LPP-Prozess hergestellt wird. Man findet vier Shader Engines, jede mit eigenem Geometrieprozessor und Draw Stream Binning Rasterizer.

Besitzt die RX Vega64 noch 64 aktive Compute Units in diesen Shader Engines, deaktiviert AMD bei der RX Vega56 zwei CUs pro Shader Engine, so dass es am Ende auf 56 hinausläuft. Womit sich dann auch die Namensgebung erklärt. Bei 64 Stream-Prozessoren und vier Textureinheiten pro CU erhält man folgerichtig 3584 Stream-Prozessoren und 224 Textureinheiten - also ca. 88% der Vega-NCU-Ressourcen.

Die niedrigere Rechenleistung und der gringere Texturendurchsatz sind auch durch die niedrigeren Basis- und typischen Boost-Taktraten bedingt. Die Radeon RX Vega56 taketet im Vergleich zur Vega64  nur noch mit 1156 MHz statt 1274 MHz, während der mögliche Boost-Takt der RX Vega56 bei 1471 MHz im Vergleich zu den 1546 MHz der RX Vega64 liegt. Die theoretische SP-Performance sinkt damit von maximal 13,7 TFLOPS auf 10,5 TFLOPS, wobei dies natürlich nur absolute Peak-Werte sind.

Jeder der Shader-Engines von Vega 10 besitzt vier Render-Back-Ends, die 16 Pixel pro Takt-Zyklus liefern, woraus sich die 64 ROPS ergeben. Diese Render Back-Ends hängen gemeinsam am L2, der jetzt 4 MB groß ist, während Fidji noch mit zwei MB L2-Kapazität auskommen müsste. Idealerweise bedeutet dies, dass die GPU weniger häufig auf den HBM2 zugreifen muss und die Abhängigkeit von Vega 10 von der Speicherbandbreite verringert. Da die Taktraten von Vega 10 auf der 56-Cu-Karte bis zu 40% höher sind als noch bei als Fiji 's, jedoch die Speicherbandbreite auf 102 GB/s sinkt, sollte ein größerer Cache hier also durchaus hilfreich sein, um Flaschenhälse auf dem Flaggschiff zu verhindern.

Der Einsatz von HBM2 ermöglicht AMD die Halbierung der Anzahl der Speicher-Stacks auf dem Interposer im Vergleich zu Fiji, was den aggregierten 4096-Bit-Bus quasi halbiert. Im Vergleich zu den 4GB-HBM-Modulen der Radeon R9 Fury X, nutzt die Radeon RX Vega56 recht komfortable 8 GB mit 4-Hi-Stacks, ähnlich wie die Vega64. Mit einer 1,6 GB/s Datenrate schafft man dann 410-GB/s-Bandbreite, was in der Theorie die Werte einer GeForce GTX 1070 bzw. GTX 1080 mit GDDR5 bzw. GDDR5X deutlich übertrifft.

Optik, Haptik und Anschlüsse

Die ca. 1064 Gramm schwere Karte (14 Gramm mehr als die Frontier Edition) ist 26,8 cm lang (ab Außenkante Slot-Blende bis Ende Gehäuse), 10,5 cm hoch (ab Oberkante Mainboard-Slot bis Oberkante Gehäuse) und 3,8 cm tief. Damit ist es eine echte Dual-Slot-Karte, auch wenn die Backplate noch einmal ca. 0,4 cm auf der Rückseite benötigt.

Gehäuseabdeckung und Backplate sind aus schwarz eloxiertem Aluminium, welches sich wertig und kühl anfasst. Die Oberflächenstruktur des Deckels wurde einfach per Kaltverformung vor dem Eloxieren realisiert. Alle Schrauben sind mattschwarz lackiert. Nur das aufgedruckte, rote Radeon-Logo an der Front hebt sich farblich deutlich ab.

Die Oberseite ist geprägt von den beiden 8-Pin PCIe-Spannunsgversorgungs-Anschlüssen, sowie dem beleuchteten, roten Radeon-Logo. Außerdem finden wir einen BIOS-Umschalter, der auf ein BIOS mit deutlich niedriger Leistungsaufnahme zugreifen lässt. Leiser, kühler und natürlich auch etwas langsamer. Zusammen mit den drei neuen Modi im Wattman "Turbo" (max. Power Limit), "Balanced" (Standardvorgabe) und "Power Save" (min. Power Limit) ergeben sich so mehrere Variationsmöglichkeiten, auf die wir später noch eingehen werden.

Das Kartenende ist geschlossen und am Rahmen findet man die bei Workstation-Karten üblichen Löcher fürs Mounting. Die mattschwarz pulverbeschichtete Slot-Blende beherbergt drei DP-Anschlüsse und einen HDMI-2.0. Auf einen DVI-I hat man aus strömungstechnischen Gründen cleverer Weise verzichtet, denn die Blende ist gleichzeitig ja der Auslass der warmen Abluft aus dem Kühlsystem.

Modell Radeon
Vega64
Radeon
Vega56
Radeon
R9 Fury X
Geforce
GTX 1080
Geforce
GTX 1070
GPUVega 10 XTXVega 10 XTXFiji XTGP104
GP104
Chipgröße484 mm²484 mm²596 mm²314 mm² 314 mm² 
Transistoren12.5 Mrd.
12.5 Mrd.8.9 Mrd.
7,2 Mrd.
7,2 Mrd.
GPU-Basistakt/
Boost-Takt
1247 MHz
1630 MHz
1156 MHz
1471 MHz
k.A.
1050 MHz
1606 MHz
1733 MHz
1506 MHz
1683 MHz
Shader/SIMD4096/643584/564096/64
2560/201920/15
Textur-Einheiten/ROPS
256/64224/64256/64160/96120/64
Speicheranbindung2048 Bit2048 Bit
4096 Bit
384 Bit
352 Bit
SpeichertypHBM2HBM2HBMGDDR5XGDDR5
Speicherbandbreite
483,8 GB/s410 GB/s512,0 GB/s320,3 GB/s256,3 GB/s
Geschw. Grafikspeicher
1,89 Gbps1,6 Gbps1,0 Gbps10,0 Gbps
8,0 Gbps
Speicherausbau
8 GB
8 GB
4 GB
8 GB
8 GB
DX12 Feature-Level12_1
12_112_012_112_1
PCIe-Buchsen2 × 8-Pin2 × 8-Pin2 × 8-Pin6 + 8-Pin8-Pin
TBP
295 Watt
210 Watt275 Watt<250 Watt <150 Watt 

Testsystem und Messmethoden

Das neue Testsystem und die -methodik haben wir im Grundlagenartikel "So testen wir Grafikkarten, Stand Februar 2017" (Englisch: "How We Test Graphics Cards") bereits sehr ausführlich beschrieben und verweisen deshalb der Einfachheit halber jetzt nur noch auf diese detaillierte Schilderung. Wer also alles noch einmal ganz genau nachlesen möchte, ist dazu gern eingeladen. Allerdings haben wir CPU und Kühlung erneut verbessert, um für diese schnelle Karte mögliche CPU-Flaschenhälse weitgehend auszuschließen.

Interessierten bietet die Zusammenfassung in Tabellenform schnell noch einen kurzen Überblick:

Testsysteme und Messräume
Hardware:
Intel Core i7-6900K @4,3 GHz
MSI X99S XPower Gaming Titanium
Corsair Vengeance DDR4-3200
1x 1 TByte Toshiba OCZ RD400 (M.2, System SSD)
2x 960 GByte Toshiba OCZ TR150 (Storage, Images)
Be Quiet Dark Power Pro 11, 850-Watt-Netzteil
Kühlung:
Alphacool Eisblock XPX
Alphacool Eiszeit 2000 Chiller
2x Be Quiet! Silent Wings 3 PWM (Closed Case Simulation)
Thermal Grizzly Kryonaut (für Kühlerwechsel)
Gehäuse:
Lian Li PC-T70 mit Erweiterungskit und Modifikationen
Modi: Open Benchtable, Closed Case
Monitor:Eizo EV3237-BK
Leistungsaufnahme:
berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card)
berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung
direkte Spannungsmessung an den jeweiligen Zuführungen und am Netzteil
2x Rohde & Schwarz HMO 3054, 500 MHz Mehrkanal-Oszillograph mit Speicherfunktion
4x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC)
4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz)
1x Rohde & Schwarz HMC 8012, Digitalmultimeter mit Speicherfunktion
Thermografie:
Optris PI640, Infrarotkamera
PI Connect Auswertungssoftware mit Profilen
Akustik:
NTI Audio M2211 (mit Kalibrierungsdatei)
Steinberg UR12 (mit Phantomspeisung für die Mikrofone)
Creative X7, Smaart v.7
eigener reflexionsarmer Messraum, 3,5 x 1,8 x 2,2 m (LxTxH)
Axialmessungen, lotrecht zur Mitte der Schallquelle(n), Messabstand 50 cm
Geräuschentwicklung in dBA (Slow) als RTA-Messung
Frequenzspektrum als Grafik
Treiber
Radeon: 17.20.1035
Quadro: R381 U2 (382.05)
Betriebssystem
Windows 10 Pro (Creators Update, alle Updates)
Erstelle einen neuen Thread im Artikel-Forum über dieses Thema
12 Kommentare
Im Forum kommentieren
    Dein Kommentar
  • mareike
    Um gleich mal mit einem positiven Kommentar zu beginnen. Die RX Vega56 ist weniger schlecht als die RX Vega64.
    0
  • FormatC
    Sie ist nicht schlecht, hätte sich AMD mit den Treibern nicht selbst ein Bein gestellt.
    0
  • FightingFalcon
    Top gemachtes Review! *thumbsup*

    Einzige Anmerkung - könntest du bitte anstelle "Disassemblierung" ein Wort benutzen das nicht so weh tut. Demontage, oder Zerlegen wären wohl die besseren Synonyme.;-)
    0
  • FormatC
    Macht der Gewohnheit, weil nun mal das Zusammensetzen in der Fabrik das gegenteilige Wort beinhaltet. Aber ich gelobe Besserung
    0
  • hannesberger77
    Die technische Daten der 1080 und 1070 in der Tabelle stimmen nicht. Copy & Paste von einer TitanXp und 1080ti.
    1
  • bigreval
    FormatC: Sie ist nicht schlecht, hätte sich AMD mit den Treibern nicht selbst ein Bein gestellt.

    Igor, das, genau DAS, sage ich schon seit Jahren! Das letzte mal hast Du für AMD eine Lanze gebrochen, wenn ich mich recht entsinne. Andere haben da mir gegenüber drastischere Worte gefunden.

    Es ist schon immer so gewesen, TOP Technik aber bescheidene Software, mal milde ausgedrückt... Leider wieder einmal... Aber das passiert mit begrenzten Ressourcen, während die anderen aus dem vollen schöpfen können...

    Toller Artikel, sehr lesenswert!
    0
  • FormatC
    Lassen wir das Dingens mal reifen, vielleicht is es ja irgendwann auch für die breite Masse verfügbar. :)
    0
  • moeppel
    Mit den AIB Karten und ein wenig FineWine™ denke ich, dass die 56 langfristig 1080 Niveau erreichen und vielleicht sogar darüber hinaus wachsen wird.

    An dem Jahr Verspätung wie auch der Tatsache, dass wenn es so kommen sollte bereits neue/besser Hardware existiert, ändert das aber leider herzlich wenig ;)

    Unter dem Strich jedoch ein relativ faires P/L - mit ein wenig undervotling zumindest.

    P.S: Stimmen die Ergebnisse bei Witcher 3? Die 64 liegt hinter der 56.

    Balken/Beschriftung vertauscht, throttling?
    0
  • FormatC
    Dieses Phänomen hatten wir auch schon bei einem VR-Benchmark. Die Karte wird einfach zu heiß und wir testen nun mal mit aufgewärmten Karten. Witcher 3 ist wirklich ein Energiefresser.
    0
  • Plitz
    Ein halber Tag ist um und schon sind die AMD Rabatte auf die neue Karte ausgelaufen und der MSRP um über 100€ überschritten.

    Fool me once, shame on you. Fool me twice, shame on me!

    Hat noch jemand dem MSRP geglaubt? So weckt man kein Vertrauen beim Kunden ;)
    0
  • FormatC
    Das alles ist komplett verkorkst gelaufen und man fragt sich manchmal schon, mit welcher Begründung so manch einer auf der Lohnliste so weit oben steht. Das ist ein Schrecken ohne Ende und nicht dazu geeignet, irgendwann man wieder gewohnt zur Tagesodnung übergehen zu können.
    0
  • Monkey Joe
    Egal, Geduldseil mutwillig gekappt und gekauft. ^^ Die 6950 muss weg sein, wenns kalt wird. Mal kucken was "lagernd" dann effektiv bedeutet...
    0