AMD Radeon RX Vega64 ohne Temperatur Limit mit interessanten Erkenntnissen

Über das Übertakten und Untervolten von AMDs Radeon RX Vega64 wurde mittlerweile viel geschrieben und spekuliert. Wir wollen versuchen, den Faktor Temperatur komplett auszuklammern und zu analysieren, was wirklich mit Takt und Spannung passiert.

Telemetrie in Hochform

Doch wie und wo wollen wir ansetzen? Um unser Anliegen zu verstehen, müssen wir dann doch erst einmal etwas tiefer in die Theorie eintauchen und zunächst einen kurzen Blick auf die Funktionsweise von Power Tune werfen. Power Tune prüft die wichtigsten Leistungsdaten der GPU in Echtzeit, fragt gleichzeitig die thermischen Sensoren ab und bezieht natürlich die Telemetrie-Daten des Spannungsreglers mit ein. All diese Werte werden permanent an den vorprogrammierten DPM Arbitrator (Digitales Power-Management) übermittelt.

Dieser Arbitrator (Mittler) kennt die Power-, thermischen und Stromstärken-Limits der GPU (BIOS, Treiber), sowie die ggf. geänderten Voreinstellungen über die Treibersoftware. Innerhalb dieser Grenzen kontrolliert er nun also alle Spannungen, Taktfrequenzen sowie die Lüftergeschwindigkeiten und versucht dabei stets, die maximale Performance aus der Karte herauszuholen. Wenn auch nur eine der Eingangsgrößen überschritten wird, kann der Arbitrator Spannung und/oder Takt zurücknehmen.

Der Kerngedanke besteht also darin, dass man über geeignete VR-Schaltkreise (Voltage Regulation) in der Lage ist, die Spannungen in sehr kurzen Intervallen - also faktisch in "Echtzeit" - den tatsächlichen Erfordernissen anzupassen. Hier greift nun auch AMDs Protokoll der zweiten Generation SVI2, das mittlerweile von allen gängigen ICs beherrscht wird und auch für APUs genutzt wird (bei denen dann zusätzlich noch der Prozessorteil über die Northbridge mit gesteuert wird).

Indem wir mittels einer überragenden Kühlung (EKWB Fullcover-Wasserblock EK-FC Radeon Vega + Alphacool Eiszeit 2000 Chiller) die Kühlung mit einer konstanten Wassertemperatur von 20°C realisieren, ist es uns gelungen, die Temperaturen als limitierenden Faktor auszuschließen.

Als Spiel nutzen wir mit "The Witcher 3: Wild Hunt" in Ultra-HD ebenfalls den Maximalfall dessen, was man an durchschnittlicher Leistungsaufnahme in einem echten Gaming-Loop abfordern kann.

Damit unterliegt am Ende beim Takt-Limit alles nur den Spannungen und Strömen, sowie der maximal anliegenden, recht konstanten Grafik-Last, die über die Power Estimation Engine zur Wirkung kommt.

Spannungen: AMDs Power Tune vs. Nvidias Boost

Die RX Vega64 nutzt zudem das ebenfalls schon von den letzten APUs und Polaris bekannte AVFS (Adaptive Voltage and Frequency Scaling). Diese Funktion soll (ähnlich wie bei Nvidias Boost) sicherstellen, das für jede auftretende Waferqualität am Ende jeder Chip individuell die maximal mögliche Performance bieten kann. Somit existiert für jede GPU auch eine individuelle Load-Line bei den Spannungsvorgaben. Nur ist bei Vega 10 dann doch so einiges anders gelöst worden, als noch bei Polaris.

Im Gegensatz zu Nvidias Boost, wo manuelle Spannungsänderungen nur über eine Art Offset vorgenommen werden können und man selbst über den Curve-Editor nie wirklich die volle Spannungskontrolle erzwingen kann, erlaubt es einem AMDs Wattman, für die beiden höchsten DPM-States die Spannung weitgehend fest vorzugeben. Das kann allerdings Segen und Fluch zugleich sein, wie wir später noch sehen werden, denn die festgelegte Spannung pro DPM-State konterkariert AVFS grundlegend und hebelt diese Automatik mit etwas Pech sogar fast komplett aus.

Wir konnten per Monitoring und direkt an der Karte messen, wie sich die Spannungen bei manueller Vorgabe mit und ohne Power-Limitierung verhalten; mit interessanten Erkenntnissen übrigens, denn es weicht sehr stark vom Verhalten der Polaris-Karten ab. Womit wir auch ein wenig der Legendenbildung vorbeugen wollen, denn alle Taktsteigerungen, die wir durch Untervolten überhaupt erreichen könnten, basierten nur auf Temperaturverringerungen bei luftgekühlten Karten. Schließt man jedoch die Temperatur als limitierenden Faktor von vornherein aus, so wie wir heute, dann werden die Karten plötzlich völlig neu gemischt (Wortspielkasse) und so manche vorgebliche Sensation wird zur Urban Legend.

Was wir genau testen wollen

Wir haben uns für das bessere Verständnis und die optimale Vergleichbarkeit auf insgesamt fünf verschiedene Einstellungen festgelegt, die jedoch vollends ausreichen, um die jeweiligen Extremwerte perfekt abzubilden:

  • Werksvoreinstellung "Balanced Mode"
  • Untervolten auf 1.0 Volt bei Standard-Power-Limit
  • Übertakten durch Anhebung des Power Limits um +50%
  • Übertakten durch Anhebung des Power Limits um +50%, 3% GPU-Taktanhebung
  • Übertakten durch Anhebung des Power Limits um +50%, 3% GPU-Taktanhebung und 1,0 Volt Spannungsvorgabe

Ein Untervolten der beiden möglichen DPM-States um niedrigere Werte als 1.0 Volt wurde in vielen Situationen instabil, wobei 0,95 Volt meist noch liefen, der Takt jedoch bereits unverhältnismäßig hoch einbrach. Im Gegenzug brachte ein Absenken der Spannungsvorgaben bei maximalem Power Limit unter den Wert von 1,0 Volt bereits einen Crash, sobald eine 3D-Anwendung startete.

Wir bauen eine optimale Kühlung

Zunächst einmal müssen wir eine potente Kühlung realisieren, die auch bei 400 Watt noch nahezu gleiche Temperaturen ermöglich, wie bei den Standardvorgaben ab Werk. Da hilft am Ende nur eine gute Wasserkühlung samt Chiller, die uns konstante 20°C an der Cold-Plate auf der GPU garantieren kann.

Hier kommt nun neben dem Alphacool Eiszeit 2000 Chiller der EK-FC Radeon Vega von EK Water Blocks ins Spiel, dessen vernickelte Kupferplatte die GPU samt Speicher, die Spannungswandler und die Spulen davor kühlt. Um es vorweg zu nehmen, dieser Kühler hat die ihm anvertraute Aufgabe grandios gemeistert.

Damit die ganze Konstruktion der Single-Slot-Wasserkühlung nicht gar so albern aussieht, nutzen wir zunächst die beiliegende, schmalere Slot-Blende und tauschen die originale Blende einfach aus. Leider sitzen die Senkkopfschrauben in den einfachen Löchern auf dem Blech außen auf, aber das ist nur ein kleiner optischer Lapsus.

Nachdem man den Interposer vorsichtig (!) von der alten sehr zähen Paste gesäubert hat, trägt man die neue Paste mit einem Spatel ganzflächig, aber möglichst dünn auf. Mögliche Wärmeleitpastenreste sind optisch sicher kein Highlight, aber zu viel Putzen mit zu viel Druck kann das Package unter Umständen auch dauerhaft schädigen.

Thermal CompoundThermal Compound

Die Wärmeleitpads verteilen wir direkt auf den passenden Flächen des Kühlblocks und nicht, wie in der Anleitung beschrieben, auf den Komponenten der Platine. Da wir lieber die Platine beim Montieren auf den liegenden Kühlerblock aufsetzen (und nicht anders herum), kann so wenigstens nichts vorzeitig abfallen.

Thermal TapeThermal Tape

Nach dem Verschrauben ist die Grafikkarte in nur wenigen Minuten wieder einsatzfähig. Die Montage ist wirklich einfach, wenn man auf den Interposer achtet.

Die nackte Rückseite zeigt die vielen Schrauben, die wir samt Polyamid-Unterlegscheiben zur Befestigung eingedreht haben. Allein das PCB um das Package ist rundherum mit sieben Schrauben fest fixiert.

Wer es noch etwas schöner und auch kühler möchte (Doubler-Chips!), der sollte die passende Back Plate gleich mitverschrauben. Es ist ein Fest für die Sinne und das potentielle Hassobjekt jeder putzenden Hausfrau. Aber es gilt die alte Weisheit: wer schön sein will, muss leiden.

Für unsere Messungen haben wir jedoch die Platte abgenommen. Sie zu zerbohren war uns dann doch zu schade.

Testsystem und Messmethoden

Das neue Testsystem und die -methodik haben wir im Grundlagenartikel "So testen wir Grafikkarten, Stand Februar 2017" (Englisch: "How We Test Graphics Cards") bereits sehr ausführlich beschrieben und verweisen deshalb der Einfachheit halber jetzt nur noch auf diese detaillierte Schilderung. Wer also alles noch einmal ganz genau nachlesen möchte, ist dazu gern eingeladen. Allerdings haben wir CPU und Kühlung erneut verbessert, um für diese schnelle Karte mögliche CPU-Flaschenhälse weitgehend auszuschließen.

Interessierten bietet die Zusammenfassung in Tabellenform schnell noch einen kurzen Überblick:

Testsysteme und Messräume
Hardware:
Intel Core i7-6900K @4,3 GHz
MSI X99S XPower Gaming Titanium
Corsair Vengeance DDR4-3200
1x 1 TByte Toshiba OCZ RD400 (M.2, System SSD)
2x 960 GByte Toshiba OCZ TR150 (Storage, Images)
Be Quiet Dark Power Pro 11, 850-Watt-Netzteil
Kühlung GPU:
EK Water Blocks EK-FC Radeon Vega
Alphacool Eiszeit 2000 Chiller
Thermal Grizzly Kryonaut (für Kühlerwechsel)
Raumtemperatur:22°C (air-con)
Gehäuse:
Lian Li PC-T70 mit Erweiterungskit und Modifikationen
Monitor:Eizo EV3237-BK
Leistungsaufnahme:
berührungslose Gleichstrommessung am PCIe-Slot (Riser-Card)
berührungslose Gleichstrommessung an der externen PCIe-Stromversorgung
direkte Spannungsmessung an den jeweiligen Zuführungen und am Netzteil
2x Rohde & Schwarz HMO 3054, 500 MHz Mehrkanal-Oszillograph mit Speicherfunktion
4x Rohde & Schwarz HZO50, Stromzangenadapter (1 mA bis 30 A, 100 KHz, DC)
4x Rohde & Schwarz HZ355, Tastteiler (10:1, 500 MHz)
1x Rohde & Schwarz HMC 8012, Digitalmultimeter mit Speicherfunktion
Thermografie:
Optris PI640, Infrarotkamera
PI Connect Auswertungssoftware mit Profilen
Erstelle einen neuen Thread im Artikel-Forum über dieses Thema
2 Kommentare
Im Forum kommentieren
    Dein Kommentar
  • Sputtelkopf
    Danke für diese tollen Artikel, ja ich meine Alle.

    Der AVFS-UV-Missinterpretations-Bug:
    Taucht wahrscheinlich in allen Power-Targets auf in denen die Volt ohne Undervolting ( also AVFS unverwirrt) häufig unter den bei Undervolting gewählten Wert fallen würde/möchte um die Bilanz auszugleichen und eine Balance anzustreben.

    Die sehr kurzen und seltenen Drops im UV unter den gewählten Volt-Wert werden also wahrscheinlich in ihrem Saving viel zu stark gewichtet, was AVFS völlig verwirrt da es seinen Fehler nicht früh genug bemerkt und immerwieder per Notbremse stolpert. (ála: Huch da hab ich mich wohl irgendwo verrechnet.)

    Das ist erst verschwunden wenn man Power-Targets nutzt in denen der Takt bei stock-Volt quasi nie unter die nun gewählten Volt fallen würde, sozusagen garkeine soo tiefen Voltvorgaben in jenem PowerTarget unter Last vorgesehen sind.
    So kommen sich AVFS-Presets und Undervolting nicht ins Gehege.

    Das erklärt dann auch, dass alles an Over- oder Undervolting zwischen PowerTarget -50% und kurz unter 50% immer Konflikte zwischen AVFS-Volt-Preset und User-Wert auslösen wird.

    Nvidias Wahl einer Offset-Lösung würde das Problem ziemlich wahrscheinlich auch bei Vega umgehen.

    Schade, dass Usern so verwehrt wird ihren Chip im UV mit deutlich unter 300W richtig auszuloten, statt nur in Bereichen oberhalb 300W freiere Hand zu bekommen.
    0
  • FormatC
    Genau dass schrieb ich ja im Artikel, wo ich auch auf Nvidias Offset verwies. Das starre Vergeben von finalen Spannungen in den DPM-States ist in dieser Form ebenfalls reichlich kontraproduktiv.
    0