ATI Radeon 5870: DirectX 11, Eyefinity und jede Menge Power

Die Cypress-Architektur im Detail

Damit die neue GPU-Generation ihre fünf Designziele erreichen konnte, musste ATI die zugrunde liegende Architektur grundlegend anpassen. Die meisten Veränderungen gehen auf die HD-4800er-Familie und sogar teilweise auf die 3800er-Reihe zurück.

Bevor wir zu den Shader-Fähigkeiten der GPU kommen, sollten wir einen Blick auf die Grafik-Engine werfen, die die sechste Generation von ATIs Tesselation Engine beinhaltet. Schon in der Vergangenheit hat die Firma Tesselation beworben. Doch wie so oft, wenn eine Funktion nur von einem Hersteller angeboten wird, kam dieses Feature nur in sehr wenigen Spielen zum Einsatz. Nun ist es aber ein Teil DirectX-11-Pipeline und steckt zwischen den Hull- und den Domain-Shadern. Der Tesselator ist eine Fixed-Function-Ausführungseinheit die, je nach eingesetzter Tesselation-Technik, entweder genutzt wird oder inaktiv bleibt.

Wie auf der vorigen Seite schon angemerkt, hat sich der Aufbau von ATIs Stream-Cores nicht verändert. Sie arbeiten in dieser Generation allerdings effizienter. Wir wissen, dass ATIs VLIW-Architektur einen effizienten Compiler benötigt, um die bestmögliche Performance zu erreichen. Ansonsten liegen einige der ALUs brach. Beim RV770 musste jeder der fünf Befehle in einem VLIW-Paket von den anderen unabhängig sein. Die Cypress-Architektur kann nun eine Multiplikation plus Addition (MAD) ausführen, die vom Ergebnis der vorherigen Operation im selben Taktschritt abhängt. Das kann beispielsweise so aussehen:

a=b*c;
d=a+x;

Beim RV770 hätten sich diese Operationen nicht dasselbe Befehlspaket teilen können. Beim Cypress geht das jedoch, weil die beiden Operationen in einer MAD-Operation zusammengefasst werden während das Ergebnis der dazwischenliegenden Multiplikation erhalten bleibt. Der RV770 verfügte auch nur über einen DP4-Befehl (ein Skalarprodukt aus vier Komponenten), während DP2- und DP3-Befehle über DP4 implementiert wurden. Die Konsequenz dieses Designs war, dass bestimmte Slots eines Befehlspakets auf unnötige Operationen verschwendet wurden. Laut ATI werden Skalarprodukte nun flexibler gehandhabt, doch wird diese Aussage aber nicht genauer erklärt. Wir nehmen an, dass die Ingenieure die DP2- und DP3-Befehle jetzt nativ umgesetzt haben um damit zu ermöglichen, dass andere Berechnungen parallel ausgeführt werden.

Auch die Handhabung von Integer-Operationen hat sich geändert. Bislang konnte jeder der vier Stream-Cores pro Takt eine Addition oder eine Bit-Shift-Operation auf eine 32-bittige Ganzzahl anwenden, während der Special-Function-Core entweder eine Multiplikation oder einen Bit-Shift ausführen konnte (ebenfalls auf eine 32-bittige Ganzzahl). Jetzt können die vier Kerne eine Multiplikation oder eine Addition pro Takt ausführen, aber nur auf 24-bittige Ganzzahlen. Diese Entscheidung war ein Kompromiss, denn AMD musste einen Mittelweg finden, um die Gesamtleistung zu verbessern ohne dafür zu viele Ressourcen aufgeben zu müssen. Letzteres wäre eingetreten, hätte man jeden der Stream-Cores mit einem eigenen vollständigen 32-bit-Integer-Multiplier ausgestattet. Indem sie sich auf 24-Bit-Operationen beschränkten, wurde es den Ingenieuren möglich, bestimmte Ressourcen auch für Fließkomma-Berechnungen in einfacher Genauigkeit zu verwenden und gleichzeitig die Auslastung der Shader zu maximieren.

Zusätzlich zu diesen Optimierungen hat ATIs Design Team zwei neue Befehle eingeführt. Die erste nennt sich Fused Multiply-Add (FMAD). Sie erhält über die gesamte Dauer der Berechnung die Genauigkeit bei und führt erst am Ende eine einzige Rundung durch. Im Gegensatz dazu rundet der konventionelle Multiply-Add-Befehl (MAD) zwei Mal. Der zweite neue Befehl bildet die Summe der absoluten Differenzen (SAD). Diese Funktion wird oft bei Video verwendet, und zwar konkret um bestimmte Pixel-Blöcke mit einander zu vergleichen. Wir überprüften die Steigerung der Rechenleistung, indem wir verschiedene Shader ausführten.

Während die Radeon HD 5870 gegenüber der HD 4870 bei den meisten einfachen DirectX-9-Shadern um den Faktor 2,26 zulegen konnte, schrumpft der Vorteil auf die 1,68-fache Leistung wenn Per-Pixel-Beleuchtung aktiviert wird.

Als nächstes folgen die DirectX-10-Shader.

Bei prozeduralen Texturen wird die theoretische Mehrleistung fast komplett umgesetzt, und die Radeon HD 5870 ist um den Faktor 2,24 schneller als die HD 4870. Es besteht kein Zweifel, dass die 1.600 Stream Prozessoren alle vorhanden sind und sich mächtig ins Zeug legen.

Wenn sich schon die Recheneinheiten nicht grundlegend geändert haben, scheint sich bei den Textureinheiten im Vergleich zum RV770 überhaupt nichts geändert zu haben. Abgesehen von der Unterstützung von 16Kx16K Texturen und den beiden neuen Formaten zur Textur-Komprimierung (die beide für DirectX 11 vorgeschrieben sind) gibt es hier nichts Neues. Das zeigt sich beim Steep Parallax Mapping recht deutlich:

Die Treiber scheinen auch für eine leichte Optimierung zu sorgen, denn wir konnten hier zwischen den beiden Radeons eine Verbesserung um den Faktor 2,35 ausmachen. Dasselbe konnten wir auch in anderen Shader wie der Fell-Darstellung beobachten.

Bei den Geometry Shadern steigt die Performance dafür nur um 42 Prozent.

Dieser letzte Test misst die Leistung beim Laden von Texturen (texture fetching performance), die beispielsweise bei Displacement Mapping wichtig ist. Hier zeigt sich eine moderate Verbesserung von 34 Prozent.

Man sollte bedenken, dass sich die Bandbreite des L1-Caches zwar erhöht hat, aber nur im selben Maße, wie neue Textureinheiten dazu gekommen sind. Ebenso ist auch der L2-Cache gewachsen, aber eben nur, weil es auch hier nun doppelt so viele Einheiten gibt. Schwerer wiegt, dass die Bandbreite der L1-/L2-Caches nur proportional mit der GPU-Frequenz gestiegen ist, obwohl nun doppelt so viele Recheneinheiten versorgt werden müssen. Möglicherweise haben wir damit gerade den Grund ausgemacht, warum der Cypress, trotzdem er über doppelt so viele Ausführungseinheiten wie sein Vorgänger verfügt, in den vorangegangenen Texturtests nicht auch doppelt so schnell ist.

Erstelle einen neuen Thread im Artikel-Forum über dieses Thema
Dieser Thread ist für Kommentare geschlossen
105 Kommentare
Im Forum kommentieren
    Dein Kommentar
  • FormatC
    Ich bin eigentlich enttäuscht und teile die Euphorie nicht.

    100€ Aufpreis für kumulierte 15% Mehrleistung im Vergleich zu einer GTX285 sind dann schon ein wenig schäbig. Wollte man nicht (wie in den eigenen lancierten Benchmarks) bereits mit der kleinen 5850 die GTX um 40% plätten? Das ist doch kein Quantensprung, sondern ein dezenter Hüpfer.

    Schade, ich hatte eigentlich im Falle eines wirklich verwertbaren Mehrwertes so eine Karte eingeplant - es lohnt sich aber offensichtlich nicht wirklich. Bei der HD2900 waren auch schöngerechnete Benchmarks vorab am Start. Und was kam dann? Die GTX 285 wird sich wohl knapp unter 200€ einpendeln. Dann wirds auch für die HD5850 schwer werden. Falls sie es vom Papiertiger mal bis Weihnachten in die Läden schaffen sollte.
    1
  • Shini
    Wie stellst du dir das vor? Nvidia mit einer GTX285 auf unter 200? Schön wärs..
    Zumal es nicht nur 15%, sondern je nach Anwendung über 20%. Lies dir am besten den CB Test auch noch durch, ich glaube die sind nicht ganz so auf Intel/Nvidia wie hier. Ausserdem handelt es sich hier um eine 1 GB Version, ich denke man kann sicvh von der 2 GB mehr erhoffen, gerade in Auflösungen ab 1920*1080/1200 mit 8x AA und HQ 16x AF, denn das wäre für eine solche Karte das optimale Einsatzgebiet.

    http://www.computerbase.de/artikel/hardware/grafikkarten/2009/test_ati_radeon_hd_5870/
    1
  • ultra1982
    hallo zusammen also da bleibe ich lieben bei nvidia die haben immer noch die nase vorn so viel unterschied ist das ja nicht naJA egal ati halt lol
    -12
  • FormatC
    Du hast mich sicher falsch verstanden. Selbst 20% Mehrleistung sind bei 100% mehr Shadern eigentlich beschämend. Ich war der Meinung, ich bekäme für 350-400€ eine Karte, die die vollmundig angekündigte Leistungsverdoppelung schafft. Zumindest ließen es die vorab von ATI gestreuten Benchmarks erhoffen.

    Und was ist heute? Die Unterfilterung ist leider immer noch ein Thema und wenn dies mit AA ausgeglichen würde, sind wiederum die fps im Keller. Bei 40-50% Mehrleistung wäre ich sicher schwach geworden. Aber so lohnt sich eine Aufrüstung nicht wirklich, es sei denn, man will als Numbercruncher bei BOINC schnell Karriere machen ;)
    0
  • fragger
    naja, wenigstens ist Nvidia jetzt in der Pflicht, was schnelleres nachzulegen...
    1
  • FormatC
    Was aber wiederum ebenfalls ein böses Dilemma wäre. Wären die neuen 300er Karten extrem viel besser, dann wären sie auch dementsprechend teurer. Sind sie es nicht, dann lohnt wiederum der Umstieg nicht. Es ist einfach nur Scheiße gelaufen.

    Gesetzt den Fall, ATI hätte wenigstens 50% Mehrwert gegenüber einer GTX285 geschafft und nVidia wäre dann mit dem 300er ähnlich gut aufgestellt, dann würden sich beide Karten Konkurrenz machen und die Preise fürs HighEnd wären erträglicher. So wird wohl NV wieder die teuren Klopper im Portfolio führen und ATI sich die eigenen Karten nach unten hin kaputt konkurrieren. Die 4er werden schlagartig aus den Regalen verschwinden und der Bereich um die 100€ wäre dann wieder mausetot.

    Dumm gelaufen. Leider.
    0
  • JTRch
    Bis wirklich Spiele draussen sind, wo man die Karte brauchen könnte, kann man die schnelleren, stromsparenderen und günstigeren Redesigns der zweiten Generation kaufen. Zudem sobald Nvidia mit ihren DX11 Karten kommt, ist mit dem ersten Preissturz zu rechnen.
    5
  • kaneeden
    Ich hatte mir erhofft dass ein cf aus 4870 geschlagen wird, schade, ich teile FC ´s Meinung über das sich abzeichnende Szenario.
    1
  • Weltenspinner
    Man darf nicht aus den Augen verlieren, dass vor allem unter DX9,
    aber auch nicht zu knapp unter DX10 noch Stark CPU und Physik bremsen.
    Ich glaube, der Grund für die "geringe" Mehrleistung liegt hier bei den Spielen.
    Die Karte ist allein so schnell, wie die alte Generation zu zweit und das
    noch ohne ihren besten Freund DX11. Warten wir einfach DX11-Spiele und
    Treiber Updates ab, dann wird die Karte schon eher zeigen können,
    was sie drauf hat. ;)

    Man darf auch nicht vergessen, dass sie endlich einen vernünftigen Idle-Modus hat
    und Mikroruckler völlig herausfallen und für die schnellste Single-GPU-Karte mit
    neuem DX zum Start 350 EUR zu verlangen, ist doch mehr als in Ordnung.
    Noch ein Pluspunkt: Im Idle liegt sie vom Verbrauchen zwischen HD4670 und GTX285.
    8
  • FormatC
    Das warten auf Wundertreiber kenne ich noch aus HD2900er Zeiten. Leider war die Karte vorher hinüber ;)
    1
  • Idleking
    Weltenspinner[..]Die Karte ist allein so schnell, wie die alte Generation zu zweit und dasnoch ohne ihren besten Freund DX11. Warten wir einfach DX11-Spiele undTreiber Updates ab, dann wird die Karte schon eher zeigen können, was sie drauf hat.[..]

    So sehe ich das auch.
    Jedenfalls hoff ich es. Denn sollte es nicht so sein, dass die neue Karte unter DX11 einen signifikanten Geschwindigkeitsschub an den Tag legt, müsste man FormatC Recht geben.
    20% Mehrleistung bei 100% mehr Ausführungseinheiten ist schon schwach.

    Bleibt - wie immer - das Warten auf DX11 und Spiele, die darauf vertrauen.
    Dann wird hoffentlich nachgetestet und wir werden sehen, was die neue Generation an Karten wirklich kann ;)

    Edit:
    So wie man bei der Konkurrenz nachlesen kann, liefert die 5870 >59% Mehrleistung gegenüber einer 4870.
    Anscheinend kommt es doch stark aufs verwendete Spiel an.
    1
  • FormatC
    Hab mal kurz aufgeräumt. Zu viel Off-Topic stört dann doch ;)
    0
  • f1delity
    Hab jetzt die Tests von CB, Golem, Heise, THG durch. Irdendwie zwiespältig, auf der einen Seite gesteigerte Effizienz und halt sehr gute Leistungsaufnahme im Idle-Modus, auf der anderen Seite die nicht revolutionäre Performance, zwar gut, aber keine 350€ wert.

    Mal schauen ob der GT300, wenn er denn mal Q1 2010 fertig ist zu einem passenden Preis sehr gute Leistung bringt, meine HD4870 pfeift so langsam aus dem letzten Loch (leistungstechnisch).

    //Edit: Beziehe mich natürlich auf 1920x1200 oder größer.
    0
  • michael21
    Also wenn man nur auf die Summary schaut siehts wirklich nciht so Spektakulär aus, aber (und das ganz dick und fett):

    1. In den Spielen, wo bei den Boliden wirklich noch unspielbare FPS kommen können, bekommt die GTX285 einfach nur Pipi in den Augen (Crysis, Stalker, GTA4).

    2. Die GTX295 ist *hust* reden wir nicht drüber. Da wo es ernst wird, zieht sie den schwanz ein (2500er - leider zu wenig VRAM)

    Nun kommen du Bonus Features dazu:
    - DX11
    - richtig guter Stromverbrauch im Idle
    - nicht zu Laut/ Heiß

    Das einzigste was z.Z. noch bitter aufstößt ist der Preis. Ansonsten doch schon recht fein.

    Also mal schauen was der Markt zum Preis sagt und was Nvidia rausbringt.
    1
  • Shini
    @FormatC

    Sicher ist die Mehrleistung gegenüber der HD4870 in der Theorie 100% aber in Spielen kommt das eben nicht zur Geltung, leider nicht.
    Und wie Weltenspinner schon gesagt hat: Auf DX11 Benches warten, denn durch die neue Softwarearchitektur verspricht DX11 einiges, siehe CT von was weis ich wann, Frühjahr 2009 müsste das gewesen sein.
    Wer weiss, vielleicht können wir unsere Karten mit Raytracing zu 100% ausnutzen ^^ (in ein paar Jahren..)
    2
  • FormatC
    Auf Crysis richtet auch diese Karte nichts. GTA ist extrem RAM abhängig, läuft aber mit einer GTX285 recht passabel und Stalker ist von ATI gekauft. Da müsste man schon andere Spiele nehmen. Wäre ich fies, würde ich NFS: Shift vorschlagen ;)
    1
  • fbx
    also die Karte ist zwar noch nicht verfügbar, dennoch teilweise schon gelistet. und das ab ca 316€; d.h. wir sind bei verfügbarkeit ganz schnell unter 300€. die GTX kostet ja auch noch mind. 260€. das finde ich für ne high end Karte mehr als Angemessen. Gerade so frisch nach dem release und das ohne Konkurrenz. (an DX11 karten) Ich kann mich noch an Karten für 500€ und mehr erinnern. Ein umrüsten von ner 285 lohnt nicht aber für jede Neuanschaffung oder ein wechseln von kleineren Karten ist mehr als gerechtfertigt. Gerade der Idle Verbrauch wurde doch millionenfach bemängelt jetzt ist er Top und schon überzeugt die Mehrleistung nicht alle. Zudem ist ja noch nen bisschen Luft nach oben. 5890?! Ich freue mich schon auf die 5770 o.ä.,
    mfg
    5
  • greatest
    Als erstes: Vielen Dank für einen wie immer sehr aussagekräftigen Test!!!

    2. Ich kann mich der Enttäuschung von FormatC nur anschließen!!!

    ATI hat von einer Überraschung gesprochen. Diese ist meiner Meinung nach ausgeblieben! Und dabei wollte ich unbedingt jetzt schon eine ATI-Karte kaufen!!!

    Ja - die neue Karte ist deutlich schneller als die Alte.
    Ja - die neue Karte bring viele Verbesserungen mit sich.
    Ja - die neue Karte hat viele sehr interessante Möglichkeiten und Funktionen

    Unter Beachtung dessen was in diesem Artikel steht und was ich bei Konkurrenz gelesen habe, kann die neue Karte nicht als „Überraschung“ bezeichnet werden.

    Die HD3870 war eine Überraschung: Sie hatte gegenüber der alten Nvidia-Karte 7900GTX mehr als die doppelte Leistung. Die 8800 Ultra hatte gegenüber dem direkten Vorgänger mehr als Doppelt so viel Leistung. Das sind Überraschungen. Wenn die HD5870 gegenüber der GTX285 gerade zwischen 20-30% Mehrleistung bietet, dann ist es keine Überraschung! Schließlich ist Nvidia die Konkurrenz für ATI und nicht die alte Generation gegenüber der wir etwa 50-60% Mehrleistung zu sehen bekommen.

    Wenn die kommende GT300er Serie ein Leistungsplus von mind. 30% mitbringt ist die Leistungskrone ebenfalls weg! Und ich glaube nicht, dass es ernsthafte Zweifel geben kann, dass die „komplett neu entwickelte“ GPU von Nvidia weniger als 50% Mehrleistung mitbringen würde. (Vorausgesetzt sie haben keine Schwierigkeiten mit der Herstellung)
    -1
  • FormatC
    Ich bin nicht enttäuscht im herkömmlichen Sinne, sondern fühle mich vom Hype und geschönten Benchmarks im Vorfeld getäuscht. Es wäre wohl sonst das erste mal gewesen, dass ich sofort nach dem Release einer neuen Generation zugeschlagen hätte. Aber wegen den paar Prozent jage ich doch keine funktionierende Karte in die Wüste.
    0
  • Brauseklaus
    @FormatC kann deine Meinung nicht ganz teilen

    1. Du hast im schlechtesten Fall ca. 20% Leistungsteigerung zur GTX285 das heißt in niedrigen Auflösungen. Bei 1920x1200 sind es schon 43% und bei 2560x1600 gar 74%!!! [Quelle CB] Desweiteren ist das der 1. Treiber, da war bei ATI gerade am Anfang immer noch Luft nach oben.

    2. Die Günstigste GTX 285 kostet heute ca. 260€ die günstigste 5870 ca. 320€ (beide Preise werden noch nachgeben) das ist eine Differenz von nur ca. 20%. Dazu gibt es DX11, geringeren Verbrauch und geringere Lautstärke.

    3. Es wurde für Nov./Dez. einen X2 angekündigt. Die wohl gegen die GTX 380 antreten soll (wenn das überhaupt nötig sein wird) und die GTX damit für dich erschwinglicher machen wird.

    4. Die 100€ Karten werden dann HD 5770/5670 oder GTS 310/350 heißen ;)

    btw.: Wurde die verbesserte BQ in diesem Bericht nicht erwähnt oder habe ich das überlesen?
    4