Anmelden mit
Registrieren | Anmelden

Mehr Leistung: 4D- statt 5D-Shader

Radeon HD6970 und HD6950 im Benchmark-Test: Cayman als Fermi-Killer?
Von

Der Wechsel von VLIW5 zu VLIW4 - Oder warum weniger durchaus mehr sein kann

Den grundlegendsten Wechsel hat AMD durch die Änderung der Shadereinheiten vollzogen. Betrachten wir zunächst rückwirkend noch einmal Cypress. Interessant sind dabei die auf dem Blockschaltbild ausgewiesenen SIMD-Kerne (Single Instruction, Multiple Data), auch bekannt als Array- oder Vektorprozessoren. 

Dieses Schema stellt einen sogenannten "Streaming Processor" (SP) innerhalb des SIMD-Kerns dar, der dazu ausgelegt ist, jeweils einen Befehl komplett und eigenständig abzuarbeiten. Dazu müssen wir jedoch noch wissen, dass ein Befehl aus mehreren Komponenten besteht. Es sind also stets mehrere Operationen notwenig, um einen Befehl komplett auszuführen. Zurück zum Kern. Mit x, y, z und w sind insgesamt 4 Recheneinheiten (ALUs) vorhanden, die gemeinsam pro Zyklus jeweils eine Rechenoperationen mit einfacher Genauigkeit, und damit im Idealfall die Komponenten eines Befehls gleichzeitig abarbeiten können. Darüber hinaus existiert eine sogenannte "T-Unit". Mit dieser speziellen Funktionseinheit (SFU) kommt eine fünfte Einheit hinzu, die neben all dem, was die 4 restlichen Einheiten auch können, auch noch transzendente Funktionen wie Sinus, Cosinus usw. beherrscht. Diese Einheit t ist also höher spezialisiert als x, y, z und w. Zusätzlich ist noch eine "Branch unit" implementiert. Wir merken uns: ein SP arbeitet stets nur einen einzigen Befehl ab, die einzelnen Komponenten des Befehls werden von den Einheiten x, y, z und w parallel, also gleichzeitig berechnet.

Was machen eigentlich Intel und Nvidia?

Blicken wir an dieser Stelle kurz über den AMD-Tellerand hinaus hinüber zu Nvidia und Intel und vergleichen die Arbeitsweise. Beide nutzen 4 ALUs - jedoch nicht parallel für eine Aufgabe, sondern für jeweils eine Aufgabe, deren Komponenten dann in Reihe abgearbeitet werden. Das bedeutet, dass mit dieser Konstellation jeweils 4 Befehle gleichzeitig abgearbeitet werden können. Die dabei notwendigen 2-4 Komponenten pro Befehl werden jedoch nacheinander in die einzelnen ALUs geschoben. In Folge dessen braucht ein Befehl dann auch mehrere Takte (Zyklen), je nach Anzahl der enthaltenen Komponenten.

Gretchenfrage: Was ist unterm Strich effizienter - eine Arbeitsgruppe, in der vier Kollegen gleichzeitig jeweils einen von 4 möglichen Arbeitsschritten ausführen (also jeder einen anderen), womit sich in der Summe ein fertiges Arbeitsprodukt pro Gruppe ergibt, oder eine Gruppe, in der die vier Kollegen jeweils alle Schritte nacheinander erledigen, also pro Takt einen, bis vier Produkte fertig sind? In der Wirtschaft hätte man jetzt die Frage Fließband- gegen Nestfertigung. Die Konsequenzen sind die gleichen.

Ein Problem und eine folgerichtige Lösung: VLIW4

Das eigentliche Problem für AMD stellt sich in der möglichst optimalen Auslasung der SPs dar. Während man bei Intel und Nvidia brav Komponente nach Komponente nachschieben kann und somit auch Befehl nach Befehl nahtlos abgearbeitet bekommt, bleibt bei AMD oft Brachland liegen. Wenn ein Befehl nur 2 Komponenten beinhaltet, bleiben 2 ALUs und die T-Unit im jeweiligen Takt beschäftigungslos. Strom verbrauchen sie deswegen trotzdem, Platz auch. Dies ist aber nur eines der Probleme. Das gewichtigere Problem ergibt sich in der logischen Folge. Wenn man schon nicht sicherstellen kann, dass alle ALUs genutzt werden, was passiert dann mit der T-Unit? Diese benötigt auf Grund der höheren Funktionsdichte mehr Platz auf dem Chip als eine normale Unit. Im Gegenzug ist aber kaum sicherzustellen, dass diese Einheit bei jedem Befehl auch genutzt wird. Hier werden Platz und Ressourcen verschenkt. Man kann das Ganze am Ende mit 4 Sporttaschen und einem großen schweren Koffer vergleichen, den man ständig leer mit sich herumschleppt, rein aus der Angst heraus, es könnte irgendwann mal ein größerer Gegenstand zu transportieren sein.

Den eingeschlagenen Weg der parallelen Abarbeitung jeweils eines Befehl hat AMD auch mit der Umstellung auf VLIW4, nennen wir es vereinfacht auch 4D-Shader, nicht verlassen. Man hat im Gegenzug aber die spezialisierte "T-Unit", also den schweren Koffer komplett weggelassen. Falls wirklich eine derartige Operation benötigt wird, kann mit Hilfe von 3 der 4 enthaltenen ALUs jederzeit eine der benötigten Funktionen nachgebildetet und ausgeführt werden. Dies spart Platz und vereinfacht sogar die Verwaltung und Zuweisung der einzelnen Befehle erheblich. Man erhofft sich bei gleichem Platz 10% mehr Rechenleistung pro mm². Ob diese Rechnung aufgeht, das wird im Folgenden die Praxis in Form unserer Benchmarks erweisen müssen.

Alle 57 Kommentare anzeigen.
Auf dieser Seiten können keine Kommentare mehr abgegeben werden
Sortieren nach: Neueste zuerst | Älteste zuerst
  • RSTE , 15. Dezember 2010 07:06
    "...Der für die Radeon HD 6870 neu erklärte "Gegner" Geforce GTX 570 kann zwar nicht so eindeutig geschlagen werden..." Sollte das nicht HD 6970 heißen?
  • FormatC , 15. Dezember 2010 07:11
    Gefixt. Immerhin hat jemand das Fazit mal aufmerksam gelesen ;) 
  • avatar_87 , 15. Dezember 2010 08:46
    RSTE"...Der für die Radeon HD 6870 neu erklärte "Gegner" Geforce GTX 570 kann zwar nicht so eindeutig geschlagen werden..." Sollte das nicht HD 6970 heißen?


    Oh no, ein Spoiler...
  • FormatC , 15. Dezember 2010 08:53
    Man beginnt das Lesen neuer Artikel ja auch nicht übers Forum :) 
  • ObiWanKenobi , 15. Dezember 2010 09:05
    Was mir sehr gefällt ist, dass 2x 460er für rund 300,- € (also Top L/P Verhältnis) die meisten relativ schlecht aussehen lässt :)  Wurde in div. Tests hier auch schon aufgelistet.

  • FormatC , 15. Dezember 2010 09:13
    Das CF mit zwei HD 6850 für 300€ kann das sogar noch ein ganzes Stück besser. So gesehen ist ein Doppel aus zwei "Billigkarten", egal ob A oder N nicht immer die schlechtere Wahl.
  • Anonymous , 15. Dezember 2010 09:52
    Zitat :
    Was mir sehr gefällt ist, dass 2x 460er für rund 300,- € (also Top L/P Verhältnis) die meisten relativ schlecht aussehen lässt Wurde in div. Tests hier auch schon aufgelistet.

    Zitat :
    Das CF mit zwei HD 6850 für 300€ kann das sogar noch ein ganzes Stück besser. So gesehen ist ein Doppel aus zwei "Billigkarten", egal ob A oder N nicht immer die schlechtere Wahl.

    Wollt ich auch grad sagen, auch wenn man sich die wichtigen MinFPS anschaut. Sonst liegen die beiden meist gleich auf mit 2fps Differenz, aber in manchen Settings und Spielen versohlt die 6850 der 460 scho gehörig den Arsch, siehe BFBC2 oder Just Cause2.

    Dass die 6970 mit der 570 konkurrieren wird, war ja schon seit ein paar Tagen absehbar. Bissl schade zwar, aber insgesamt vernünftig. Ich finde das jetzt auch nicht dramatisch, auch wenn man jetzt eine Handvoll mit Geld um sich werfende Enthusiasten nicht mehr so gut bedienen kann. Mit der 5970 steht man vom Datenblatt her immernoch besser da als die 580 und ne neue Dualchip-Karte kommt ja eventuell noch. Preislich find ich die Neuen interessant positioniert und irgendwie wirken sie rund, guter Kühler, gute Leistung, guter Preis. Ich bin gespannt ob Nvidia seine 560 noch mal aufpumpt um näher an die 6950 zu kommen, wobei dann die Lücke zur 550 zu groß würde. Vermutlich werden eh viele lieber zu einem CF oder SLI greifen, statt zu den dicken Karten, wenn man sich die Resultate so anschaut.
    Dual Bios ist mal ne interessante Neuerung, mit sowas auf der Platine würd ich mich auch wohler fühlen.
    Was man sagen muss, ist dass AMD mit ihrem Chip (389mm² (69xx) und 225mm² (68xx)) immer noch wesentlich günstiger produzieren kann als Nvidia (520mm² (GF110) und 322mm²(GF104)). Für einen Preiskampf ist man bei AMD also gut gewappnet.

    @FormatC: Eine Frage zum Throtteln. Was passiert bei starkem OC? Wird das einem damit etwa versaut und OC schadet unter Umständen der Leistung sogar? Würdest du sagen, dass das Throtteln in der Praxis von hoher Relevanz ist oder doch eher ganz ganz selten zu Tage tritt, tritt es etwa schon auf wenn man mal wirklich spielt und nicht nur einen Benchmarkdurchlauf macht? Bei welchen Temperaturen setzt es etwa ein? Thx

    Willst du nicht mir die ein oder andere Grafikkarte aus dem Parcour mir zu Weihnachten schenken? :ange: 
    ich war zwar nicht brav aber trotzdem
    ich nehm mal an du musst die wieder abgeben, krasse Sammlung

    Der Test insgesamt ist echt genial, ums mal deutlich zu sagen.
  • FormatC , 15. Dezember 2010 10:04
    Beide Karten sind leider keine OC-Wunder. Das, was PowerTune als Maximum bietet, wirst Du als Dauerleistung unter Vollast auch kaum toppen können. Weil einfach der Mechanichtsnutz greift. Das siehst Du ja auch am Unterschied zur 6950. Die ist so viel langsamer nicht, aber einen Riesenzacken effizienter. Die 6970 ist genauso ausgequetscht, wie die GTX570. Auch die lässt noch Taktsteigerungen zu, mauert aber dann beim Abruf der leistung aus thermischen Gründen.
  • Gudi , 15. Dezember 2010 10:20
    Danke zunächst einmal für den sehr umfassenden Test. Nach vielen, vielen Jahren des Stolperns bezüglich Crossfire, scheint man hier ja wirklich in Tritt gekommen zu sein.
    ATI hat ja in den Jahren zuvor auch den pragmatischen Weg gewählt, insofern verwundert es nicht, dass man nicht um jeden Preis dem Titel der schnellsten Singelchip-Grafikkarte hinterher jagt, obwohl man sich glaube ich trotzdem ursprünglich mehr versprochen hatte. NVIDIA hat sie da schlicht mit der 500er Serie überrumpelt.
    Der Verdienst pro Chip dürfte bei AMD wegen der kleineren Maße höher sein.
    Insgesamt haben wir jetzt genau das, was uns das ganze letzte Jahr gefehlt hat, nämlich zwei Konkurrenten auf Augenhöhe, die sich über den Preis bekriegen werden (müssen).
    Dem Diagramm Metro 2033 auf der Seite Leistungsaufnahme und Lautstärke könnte man vielleicht Einheiten verpassen.
  • daimonion81 , 15. Dezember 2010 10:28
    Wie immer ein sehr guter Artikel.

    Durch die neuen Kartennamen, die 6800er entsprechen den 5700ern, die 6900er den 5800ern, hat AMD zumindest eins geschafft:
    Die Aktuelle 6970 ist langsamer als die 5970. Das war sicher so nicht geplant, und es wird sich zeigen, was der nicht so gut informierte Kunde davon hält. Die Rechnung mit dem "Umlabeln", wenn man es so nennen kann, ist nicht aufgegangen, die Möglichkeit, eine Doppelchipkarte im 6900er Schema herauszubringen, ist wohl vertan (6990???).

    Die erste Seite hat das geschickt angedeutet, ich fand es gelungen geschrieben!
  • Anonymous , 15. Dezember 2010 10:38
    Zitat :
    eine Doppelchipkarte im 6900er Schema herauszubringen, ist wohl vertan (6990???).

    versteh ich nicht. was spricht gegen 6990? als würde amd sein namensschema nicht so auslegen, dass man auch für jedes produkt nen namen findet

    Zitat :
    Die Aktuelle 6970 ist langsamer als die 5970. Das war sicher so nicht geplant

    Also meiner Meinung nach war das in dem Moment klar, als die 5970 rausgekommen ist und man deren massive Power gesehen hat und dann bekannt wurde, dass es bei TSMC nix wird mit 32nm. So eine Differenz holst du ohne Shrink nicht raus. Ich bin mir sicher, dass AMD das so geplant hat. Das Einzige, womit sie wohl nicht gerechnet haben, ist, dass Nvidia ihren ehemals derart verfetteten Athleten so schnell in eine gute Form gebracht haben.
  • Techniker Freak , 15. Dezember 2010 12:26
    Zitat :
    Rein subjektiv erschien uns die Filterung der HD 6900 ähnlich zur 69800, also immer noch nicht wirklich perfekt.

    Und sie ist wieder da, die 69800 ;) 

    Sehr interessanter Test, auch wenn der erhoffte Griff nach der Leistungskrone ausgeblieben ist hat AMD doch zwei solide Karten abliefern können. Vor allem die Steigerung im Crossfire sind beachtlich.
  • netrunner , 15. Dezember 2010 12:32
    Sehr netter Test, aber unverständlich bleibt warum man die 460/6850 Duos in der Mehrkarten-Skalierungsanalyse weggelassen hat. Gerade da steckt doch Preis/Leistungsmäßig das Feuer: Warum sollte man 259€ für ne 6950 augeben, wenn man fürs selbe Geld 2 460-er bekommt, die fast alle anderen Single-Chip-Karten verblasen?
  • FormatC , 15. Dezember 2010 12:36
    Deren Ergebnisse stehen doch schon bei den normalen Einzeltests! Und zwar mit Absicht und genau deswegen, weil sie sich eben preislich noch in der Liga der teuren Einzelkarten bewegen. Und die zwei 460 lassen sich von zwei 6850ern in den meisten Fällen verblasen ;) 
  • CaptainChaos , 15. Dezember 2010 13:03
    Nachdem jetzt fast alle Karten der aktuellen Generationen draußen sind (GTX 560 und HD 6990 fehlen noch), schauen die 460/6850 als Doppelgespann wirklich sehr gut aus, doch auch bei der aktuellen Generation ist doch das Problem mit den Mikroruckeln nicht gelöst, oder? Wenn in 1-2 Jahren die ersten Spiele wieder niedrigere Frameraten mit sich bringen, werden GTX 570 und HD 6970 dann womöglich bessere Bildqualität liefern, als ein SLI oder Crossfiregespann, wo relativ schnell Mikroruckler auftreten. Wenn das Problem mal in den Griff zu bekommen wäre, würde ich mir auch zwei Karten holen. Aktuell scheint die Leistung ja locker zu reichen, aber eine Grafikkarte bleibt bei mir mindestens drei Jahre im Einsatz.
  • netrunner , 15. Dezember 2010 13:06
    Das ist richtig, nur ist leider aufgrund teilweise unterschiedlicher Qualitäteinstellungen bei der Mehrkarten-Analyse der Vergleich ebenfalls teilweise nicht mehr gegeben, und man hätte sie schoen untereinnander :-).
  • FormatC , 15. Dezember 2010 13:10
    Tja, so viel Zeit war dann am Ende irgendwo nicht mehr :) 
  • legdocheinei , 15. Dezember 2010 15:12
    Interessanter Artikel, wobei man bei den Auswertungen sehr schnell den Überblick verliert. Die Karten tauschen fröhlich ihre Position auf der Leistungsachse von Benchmark zu Benchmark. Die gebotenen Leistungen variieren von Spiel zu Spiel und manchmal sogar innerhalb eines Spiels zwischen niedrigen und hohen Auflösungen.

    So ergibt sich dann auch ein Fazit, welches leider keinen leistungsmäßigen Gesamtvergleich bietet (oder bieten kann).

    Mit der Verfügbarkeit sieht es bei den neuen 69xxern auf jeden Fall schon mal besser aus, als beim damaligen 58xxer-Launch. Schon bei meinem Händler um die Ecke sind sowohl 6950 wie auch 6970 verfügbar. Allerdings werden die Karten flächendeckend zu 280/370 Euro und damit oberhalb der Preisempfehlungen von 260/330 Euro angeboten.

    Im Kielwasser der neuen Boliden kommen aber die Preise der bisherigen Topkarten ins schwanken. Mit 190/250 Euro sind auch 5850/5870 nochmal interessant.

    Achja, noch zwei Fragen zu den Anschlüssen:
    - über die 2 DPs lassen sich insgesamt 6 Montore anschließen (ohne HDMI/DVI zu nutzen)?
    - lässt sich nun mittels 2 DVIs und einem HDMI Eyefinity ohne DP nutzen?
  • FormatC , 15. Dezember 2010 15:43
    Zweimal Ja.

    Ich bin im Vergleich zu manch anderem Autor diverser Reviews eher vorsichtig mit einem einseitigen Fazit - zu durchwachsen sind die Ergebnisse von Fall zu Fall. Ich würde mir auch nicht anmaßen, einen totalen Verriss zu schreiben, denn dann müsste man alle Karten in die Tonne werfen. Grün und rot. So ausgeglichen war das schon lange nicht mehr.
  • Toxi1965 , 15. Dezember 2010 15:59
    Klasse Test ...ein kompliment an THQ :) 

    Finde die 6950 ist eigentlich die bessere Karte , da bekommt man richtig was fürs Geld .

    Die 6970 entäuscht schon ein wenig , da hab ich mehr von versprochen .
Alle Kommentare anzeigen