Anmelden mit
Registrieren | Anmelden

Jaguar: Ein stromsparender x86-Core

AMD Kabini: Jaguar und GCN in einer 15 W APU
Von

Wir haben hier auf Tom's Hardware schon eine ganze Reihe von AMD APUs vorgestellt – APUs vereinen bekanntlich klassische x86-Rechenkerne und eine Grafikeinheit auf einem einzigen Siliziumplättchen. Die erste APU-Generation war Llano für mobile Geräte (siehe auch: Nächster Halt, Llano! AMDs A8-3500M APU stellt sich dem Test), es folgte Trinity auf dem Desktop: Der Vorab-Test von AMDs A10-5800K, A8-5600K und A6-5400K. Diese beiden APU-Designs wurden erst nach den Performance-orientierten Stars- und Piledriver-CPUs auf den Markt gebracht.

Um ein früheres Beispiel für die stromsparende Produktlinie von AMD zu finden, müssen wir im Archiv bis zum Februar 2011 zurückgehen - zum Artikel Mini-Fusion mit ASRock und MSI: AMDs Brazos ist da. Das Kernstück der Brazos-Plattform war die Zacate-APU. Eine Zacate-APU besteht intern aus zwei mit 1,6 GHz getakteten x86-Kernen der Bobcat-Architektur und der Cedar-GPU, die der Radeon HD 5450-Karte ähnelte.

Die Jaguar-Architektur, mit der wir uns heute beschäftigen, ist eine Weiterentwicklung von Bobcat. Als die Entwicklung von Jaguar begann, nannte AMD drei Hauptziele: Erstens - die Verbesserung des IPC-Werts, also der durchschnittlich pro Takt ausgeführten Befehle. Denn Bobcat war extrem langsam – nur geringfügig schneller als ein Intel Atom 330 aus dem Jahr 2008. Zweitens – Modernisierung des Befehlssatzes, also Unterstützung von SSE 4.1, SSE 4.2 und AVX. Drittens – bessere Portabilität auf neue Halbleiterprozesse und zu anderen Chipfabriken.

Als Endkunden tangiert uns der letztgenannte Punkt nur peripher. Die Modernisierung des Befehlssatzes ist zwar überfällig, aber nicht besonders spannend, denn deutliche Performancegewinne sind meist nur in einigen wenigen, befehlssatzsensitiven Benchmarks zu erwarten. Aber was uns so richtig den Mund wässrig macht sind die Bestrebungen von AMD, den IPC-Wert zu verbessern.

Besprechen wir zunächst die grobe Architektur. Die für Notebooks und Tablets bestimmten Varianten von Jaguar werden in Zwei- und in Vierkernversionen ausgeliefert werden, während Bobcat-Chips maximal zwei Cores aufwiesen. Eine auf Jaguar basierende Quad-Core-APU muss aktiv gekühlt werden, aber eine Dual-Core-APU sollte im Normalfall mit einem passiven Kühlkörper auskommen.

Die Jaguar-Chips werden mit 28nm-Prozesstechnologie gefertigt, und AMDs CTO  Joe Macri ist stolz darauf, dass das CPU-Team einige der bislang nur für GPUs genutzten Optimierungstools verwendet hat und dadurch den Flächenbedarf der x86-Cores verringern konnte. Das Resultat ist, dass pro Jaguar-Core nur 3,1 mm² Chipfläche benötigt werden – deutlich weniger als beim 40nm Bobcat, wo der Flächenbedarf eines Cores noch 4,9 mm² betrug.

Doch wo weist die Jaguar-Architektur abgesehen von der Chiptechnologie gegenüber der Bobcat-Architektur Verbesserungen auf? Der Befehls-Cache (Instrucion Cache, IC) von Jaguar ist zwar gleich groß geblieben, aber der Stromverbrauch beim Lesen des Caches wurde reduziert. Darüber hinaus wurde dem Cache ein sogenannter Loop-Buffer zur Seite gestellt, was eine Stromersparnis in engen Programmschleifen bewirkt, denn der große Instruction-Cache kann dann auf ‘Standby’ bleiben; und auch die Latenzzeit sinkt dadurch.

Der Befehls-Pufferspeicher ist rund 30% größer als bei Bobcat, was einen Cache-Miss weniger schmerzhaft macht.

Zu guter Letzt wurde die Länge der Befehlspipeline um einen Dekodierschritt erhöht. Wie der Pentium 4 vor Augen geführt hat, sind extrem lange Pipelines hoher Performance eher abträglich. Aber in diesem Fall hat AMD die Länge nur geringfügig erhöht und lukriert zum Ausgleich eine höhere Taktrate.

Die Integer-Pipeline hat eine Divisionseinheit erhalten, die von Llanos Stars-Architektur abstammt und für Jaguar leicht modifiziert wurde. Einige komplexere Operationen (‘cops’ im Prozessordesigner-Jargon) erhielten ebenfalls Hardwareunterstützung und auch eine Hardware-CRC-Einheit ist nun vorhanden. Instruktions-Scheduler und Reorder-Speicher (ROBs) wurden zwischen 30% und 70% vergrößert, um die Out-Of-Order-Befehlsausführung zu verbessern. 

Der L2-Cache und seine Schnittstelle zu den CPU-Cores wurden komplett neu entworfen. Es handelt sich um einen 2 MB großen Cache, der aus vier Bänken zu je 512 MB besteht und 16-fach assoziativ ist. Bei Bobcat war der L2-Cache für jeden Core separat vorhanden und nur 512 MB groß. Laut AMD kommt ein einziger, großer Cache, den alle Cores ansprechen können, sowohl Einzelthreadanwendungen als auch Parallelanwendungen zu Gute.

Der L2-Cache von Bobcat lief nur mit der halben CPU-Taktfrequenz. Sein Jaguar-Pendant läuft hingegen mit vollem CPU-Takt, und auch die Prefetch-Einheit wurde verbessert – sie achtet nunmehr auch auf Daten-Musterund kann dadurch zukünftige CPU-Instruktionen mit einer höheren Trefferrate vorab laden. Dem L2-Cache wurden sechzehn Snoop-Einträge hinzugefügt. AMD meint, dass die Verbesserungen des L2-Cache am meisten zum IPC-Vorsprung gegenüber der Bobcat-Architektur beigetragen haben.

Die Schreib-Lese-Einheiten zwischen der Ausführungseinheit und ICache (im Diagramm links oben) sowie DCache (im Diagramm links unten) wurden ebenfalls verbessert, damit die bei den Caches vorgenommenen Performanceverbesserungen auch wirklich der Ausführungseinheit zu Gute kommen. Lesevorgänge werden nunmehr kombiniert und landen in einem größeren Puffer. Der größere Pufferspeicher beschleunigt auch Schreibvorgänge durch Minimierung von Store Data Shuffling.

AMD gibt an, dass diese Designverbesserungen zu einem Performancegewinn von 22% gegenüber Bobcat geführt haben, und zwar bei gleicher Taktrate. Jaguar erlaubt aber auch höhere Taktraten, sodass der wirkliche Performancezuwachs viel höher ausfallen sollte. Wir wollen uns aber nicht auf die Werksangaben verlassen, sondern haben das auch selbst nachgeprüft, wie auf den folgenden Seiten zu lesen ist...

Experten im Forum befragen

Zu diesem Thema einen neuen Thread im Forum Artikel erstellen.

Beispiel: Notebook, Festplatte, Speicher

Alle 11 Kommentare anzeigen.
Auf dieser Seiten können keine Kommentare mehr abgegeben werden
Sortieren nach: Neueste zuerst | Älteste zuerst
  • aarfy , 3. Juni 2013 09:30
    Ich habe ja schon länger auf einen vernünftigen Test der Kabini 5000er APU gewartet, da die ja deutlich mehr Performance wie der Temash Quad verspricht (angesichts fast der doppelten TDP). Diesbezüglich bin ich sehr enttäuscht durch euren Test, AMD verschenkt viel zu viel durch die schwache GPU. Leider haben sie immer noch nicht erkannt, dass sie sich mit Intel momentan nur im Grafikbereich wirklich messen können. Wobei das Screen-Mirror Feature wirklich interessant klingt.. könnte man vielleicht mal testen ob das auch so funktioniert wie versprochen (dlna etc.)
    Verbaut ist der Temash A6-1450 übrigens schon im „Aspire V5-122P„ vielleicht bekommt ihr mal ein Exemplar zum testen. Auch wenn das Ding leider sehr schlecht implementiert ist (VIEL zu kleiner Akku), und da leider sehr viel liegen lässt. Da wäre ein Laptop mit Tabletlaufzeit zu kleinem Preis möglich gewesen.. Aber vielleicht kommt ja noch was nach.
  • Nicht ich , 3. Juni 2013 11:36
    Schau mal hier:
    http://www.computerbase.de/artikel/prozessoren/2013/amd-temash-und-kabini-im-test/
  • woidviertla , 3. Juni 2013 11:37
    Dieser Artikel ist wie von tomshardware gewohnt umfangreich, kompetent und grundsätzlich auch dieses Mal seriös.
    Allerdings finde ich es ein zumindest voreilig, ja sogar ein bisschen unfair, den A4-5000 mit einem Ivy-Bridge Core-i3U zu vergleichen und zu sagen, dass er ist der selben Preisklasse liegt..
    Wenn man die Werte des bisherigen AMD E2-2000 als Richtwert hernimmt, dann ist der Intel 50-60,- € teurer. Und das ist gerade im Einsteiger-Segment ziemlich viel "Holz".
    Punkto Rechenleistung und Preis wäre wenn, dann schon der 1/3 schneller A6-5200 Kabini der aus meiner Sicht geeignetere Vergleichspartner gewesen.
    Klar ist aber auch, dass AMD und Intel beide einen guten Job bei den energiesparsamen CPUs machen und sich gegenseitig wirklich nichts schenken.
    Von Preis-Leistungsverhältnis liegen der Kabini und der Ivy-Bridge-U wohl gleich auf, wenn auch mit unterschiedlichen Gewichtungen (AMD wohl preiswerter, Intel schneller).
  • batman007 , 3. Juni 2013 22:13
    Also die Testmethode bei allen Testgeräten gleich "schwache" Ram Module zu Verbauen finde ich mehr als fraglich, das hat nichts damit zu tun dass man die Modele unter gleichen Bedienungen testet, man verfälscht teilweise die Werte völlig.
    Aber halten wir mal fest: Pentium B960 unterstützt nur bis DDR3-1333, Core i3-3217U und die Kabni A4 5000 jeweils 1600 DDR3 Ram. Also nur weil der B960 einen Speichercontroller bis 1333Mhz müssen die anderen sich nach unten Anpassen? Die Architekturen sind zudem völlig unterschiedlich und Reagieren dementsprechend. Sowohl die i3 als auch A4 Kabni sollte hier dann mit 1600 getestet werden, dann weiß man was die Architektur auch kann und es wäre fair.
    Bei CB erreicht Kabni 1.5 Pkt. im Cinebench, bei euch lediglich 1.11 Pkt., ist nur ein Beispiel, leider benutzt Ihr völlig andere Benchmarks, so dass weitere direkte Gegenüberstellung nicht möglich ist.
    Auch CB schaft es die deutliche Verbesserung gegenüber dem Vorgänger (Brazos E2000) zu Erkennen, mit gleichzeitiger Senkung der TDP.
    Eine weitere Testseite zeigt ebenso die Stärken von Kabini, diese schlägt sogar in manchen Disziplin die i5 und i7 CPU, auch wenn es die Ausnahme ist. Sorry, aber mich konnte euer Test nicht Überzeugen.
    http://techreport.com/review/24856/amd-a4-5000-kabini-apu-reviewed
  • batman007 , 3. Juni 2013 22:51
    Ein weiteres Fazit von euch"Aber wie schlägt sich der Core i3-3217U, ein Prozessor, der nur 17W verbraucht? In der Tat handelt es sich hier um einen gefährlicheren Gegner für die neue APU, und seine auf dem Chip eingebaute HD Graphics 4000-Einheit trampelt mit ihren 16 EUs so richtig über die 128 ALUs der A4 APU drüber"
    Man schaue sich Spiele Benchmarks an wo die Quadcore APU Ihre Kerne auch Ausspielen darf und schon sieht sogar die i3 CPU die Rücklichter.
    http://techreport.com/review/24856/amd-a4-5000-kabini-apu-reviewed/8
    http://techreport.com/review/24856/amd-a4-5000-kabini-apu-reviewed/7
    Man sollte schon mehr Differenzieren bei so einen Test und die Benchmarks auch etwas Streuen, und nicht nur die nehmen die nur von 2 Kernen Profitieren, das erwarte ich jedenfalls von einer Fachhardwareseite.
  • Erik Wolfgangsson , 4. Juni 2013 01:15
    Schön, daß sie es nicht versäumt haben nach jedem Diagramm darauf hinzuweisen, daß der A4 letzter ist.
    Warum muss man in der Leistungsklasse erstens CPU-fresser wie Skyrim und F1 testen, sowie Grafikfresser wie TR und Metro? Warum nicht noch Crysis3?
    Zitat :
    Die Autorennspiele von Codemaster(?) sind bekannt dafür, dass sie auch auf Billighardware laufen, und daher haben wir die drei Prozessoren im Spiel F1 2012 bei einer Auflösung von 1280x720 und geringer Detailstufe gegeneinander antreten lassen.
    Das ist falsch. F1 ist CPU-limitiert und unterstützt nur 2 Kerne, ebenso wie Skyrim.
    Zitat :
    Obwohl der Notebook(?) mit der Kabini-APU im F1 2012-Benchmark, wie besprochen, keine besonders gute Figur macht, verbraucht er dabei auch deutlich weniger Strom als die beiden Notebooks mit Intel-CPU, insbesondere wenn man den Pentium-Notebook als Vergleichsbasis heranzieht.
    Kann mir das jemand ins logische Übersetzen?
    Zitat :
    Wir waren von den ernüchternden Spiele-Benchmarkergebnissen gelinde gesagt überrascht – von Llano und Trinity hatten wir in Erinnerung, dass sich AMD-APUs durchaus für 3D-Spiele eignen.
    Achso, stimmt. Mit Brazos(dem wirklichen Vorgänger) konnte man schließlich auch schon BF3 mit 60FS spielen. Falsche Annahmen, um später enttäuscht sein zu können. Das hat nichts mit Journalismus zu tun.
    Zitat :
    AMD gibt an, dass diese Designverbesserungen zu einem Performancegewinn von 22% gegenüber Bobcat geführt haben, und zwar bei gleicher Taktrate. Jaguar erlaubt aber auch höhere Taktraten, sodass der wirkliche Performancezuwachs viel höher ausfallen sollte. Wir wollen uns aber nicht auf die Werksangaben verlassen, sondern haben das auch selbst nachgeprüft, wie auf den folgenden Seiten zu lesen ist...
    Und wo ist diese Versprochene Prüfung? Warum wird kein Brazos Notebook mitgetestet?
    Der Test ist kompletter Müll. THG hat ja in letzter Zeit ganz gute Tests abgeliefert, aber das ist Schrott hoch zehn. Die ganzen Schreibfehler ergänzen den erbärmlichen Artikel noch.
    Warum nur 1333er Ram? Und warum wird nirgends in diesem Test auf das Singelchannel Speicherinterface hingewiesen?
  • isigrim , 4. Juni 2013 07:00
    So könnt ihr dann eure guten Tests der letzten Zeit auch wieder kaputt machen, indem ihr hier sowas veröffentlicht.

    Bei Kabini, der ein Single-Channel Speicherinterface hat, einfach mal niedriger getakteten RAM zu verwenden (ihr musstet ja den verbauten 1600 Mhz extra ausbauen, oder?), erfordert schon eine Menge Ignoranz (ich unterstelle jetzt mal Unwissen, denn die Alternative wäre böse Absicht). Schon Brazos hängt ja an einem Speicherlimit, bei Kabini hat sich aber die Kernanzahl verdoppelt und die GPU hat deutlich mehr Bums.

    Sollte es Unwissen gewesen sein, dann ergänzt doch bitte einfach mal die Werte, die das Gerät mit 1600 Mhz Speicher erreicht. Dann sieht man trotzdem, was bei RAM Gleichstand an Ergebnissen rauskommt und gleichzeitig sieht man aber auch, was der vorliegende Kabini wirklich leisten kann und darum geht´s doch irgendwie oder?
  • modena , 6. Juni 2013 13:30
    Ausserdem ist Temash/Kabini ein SoC, also der Chipsatz ist auch noch im Package.
    Drum ist es logisch dass ein 15W Kabini deutlich weniger braucht als ein 17W ULV IB wo noch der Chipsatz dazukommt.
    Wenn ihr schon CPU's mit deutlich!!!! unterschiedlichen Preisen vergleichen wollt
    dann sollte wohl eher der 25W Kabini A6-5200 der Gegner eines 17W ULV IB sein.
    Dann dürfte auch der Verbrauch ausgeglichen sein. Und bitte jeweils mit 1600er Ram.
  • benkraft , 10. Juni 2013 09:04
    Danke an alle. Ich habe das kritische Feedback an unsere Kollegen in USA, von denen der Test stammte, weiter gegeben. Es soll in zukünftigen Tests berücksichtigt werden.
  • woidviertla , 15. Juni 2013 00:44
    Zitat :
    Danke an alle. Ich habe das kritische Feedback an unsere Kollegen in USA, von denen der Test stammte, weiter gegeben. Es soll in zukünftigen Tests berücksichtigt werden.


    Gibt es bei Tom's Hardware auch einen "Gefällt mir" Knopf?
    Würde Ihnen für dieses Statement gerne klicken :) 
  • batman007 , 16. Juni 2013 03:04
    Zitat :
    Zitat :
    Danke an alle. Ich habe das kritische Feedback an unsere Kollegen in USA, von denen der Test stammte, weiter gegeben. Es soll in zukünftigen Tests berücksichtigt werden.


    Gibt es bei Tom's Hardware auch einen "Gefällt mir" Knopf?
    Würde Ihnen für dieses Statement gerne klicken :) 


    Danke, normalerweise gibt es das hier. Aber die Seite von TH ist sowieso etwas komisch. Zur Zeit kann ich noch nicht mal Kommentare schicken, vielleicht ist es auch so gewollt?!? Aber kein Thema für mich, nur komische test von "Experten", da kann ich nur mit den Kopf schütteln. Lg