Wir haben hier auf Tom's Hardware schon eine ganze Reihe von AMD APUs vorgestellt – APUs vereinen bekanntlich klassische x86-Rechenkerne und eine Grafikeinheit auf einem einzigen Siliziumplättchen. Die erste APU-Generation war Llano für mobile Geräte (siehe auch: Nächster Halt, Llano! AMDs A8-3500M APU stellt sich dem Test), es folgte Trinity auf dem Desktop: Der Vorab-Test von AMDs A10-5800K, A8-5600K und A6-5400K. Diese beiden APU-Designs wurden erst nach den Performance-orientierten Stars- und Piledriver-CPUs auf den Markt gebracht.
Um ein früheres Beispiel für die stromsparende Produktlinie von AMD zu finden, müssen wir im Archiv bis zum Februar 2011 zurückgehen - zum Artikel Mini-Fusion mit ASRock und MSI: AMDs Brazos ist da. Das Kernstück der Brazos-Plattform war die Zacate-APU. Eine Zacate-APU besteht intern aus zwei mit 1,6 GHz getakteten x86-Kernen der Bobcat-Architektur und der Cedar-GPU, die der Radeon HD 5450-Karte ähnelte.
Die Jaguar-Architektur, mit der wir uns heute beschäftigen, ist eine Weiterentwicklung von Bobcat. Als die Entwicklung von Jaguar begann, nannte AMD drei Hauptziele: Erstens - die Verbesserung des IPC-Werts, also der durchschnittlich pro Takt ausgeführten Befehle. Denn Bobcat war extrem langsam – nur geringfügig schneller als ein Intel Atom 330 aus dem Jahr 2008. Zweitens – Modernisierung des Befehlssatzes, also Unterstützung von SSE 4.1, SSE 4.2 und AVX. Drittens – bessere Portabilität auf neue Halbleiterprozesse und zu anderen Chipfabriken.
Als Endkunden tangiert uns der letztgenannte Punkt nur peripher. Die Modernisierung des Befehlssatzes ist zwar überfällig, aber nicht besonders spannend, denn deutliche Performancegewinne sind meist nur in einigen wenigen, befehlssatzsensitiven Benchmarks zu erwarten. Aber was uns so richtig den Mund wässrig macht sind die Bestrebungen von AMD, den IPC-Wert zu verbessern.

Besprechen wir zunächst die grobe Architektur. Die für Notebooks und Tablets bestimmten Varianten von Jaguar werden in Zwei- und in Vierkernversionen ausgeliefert werden, während Bobcat-Chips maximal zwei Cores aufwiesen. Eine auf Jaguar basierende Quad-Core-APU muss aktiv gekühlt werden, aber eine Dual-Core-APU sollte im Normalfall mit einem passiven Kühlkörper auskommen.
Die Jaguar-Chips werden mit 28nm-Prozesstechnologie gefertigt, und AMDs CTO Joe Macri ist stolz darauf, dass das CPU-Team einige der bislang nur für GPUs genutzten Optimierungstools verwendet hat und dadurch den Flächenbedarf der x86-Cores verringern konnte. Das Resultat ist, dass pro Jaguar-Core nur 3,1 mm² Chipfläche benötigt werden – deutlich weniger als beim 40nm Bobcat, wo der Flächenbedarf eines Cores noch 4,9 mm² betrug.

Doch wo weist die Jaguar-Architektur abgesehen von der Chiptechnologie gegenüber der Bobcat-Architektur Verbesserungen auf? Der Befehls-Cache (Instrucion Cache, IC) von Jaguar ist zwar gleich groß geblieben, aber der Stromverbrauch beim Lesen des Caches wurde reduziert. Darüber hinaus wurde dem Cache ein sogenannter Loop-Buffer zur Seite gestellt, was eine Stromersparnis in engen Programmschleifen bewirkt, denn der große Instruction-Cache kann dann auf ‘Standby’ bleiben; und auch die Latenzzeit sinkt dadurch.
Der Befehls-Pufferspeicher ist rund 30% größer als bei Bobcat, was einen Cache-Miss weniger schmerzhaft macht.
Zu guter Letzt wurde die Länge der Befehlspipeline um einen Dekodierschritt erhöht. Wie der Pentium 4 vor Augen geführt hat, sind extrem lange Pipelines hoher Performance eher abträglich. Aber in diesem Fall hat AMD die Länge nur geringfügig erhöht und lukriert zum Ausgleich eine höhere Taktrate.

Die Integer-Pipeline hat eine Divisionseinheit erhalten, die von Llanos Stars-Architektur abstammt und für Jaguar leicht modifiziert wurde. Einige komplexere Operationen (‘cops’ im Prozessordesigner-Jargon) erhielten ebenfalls Hardwareunterstützung und auch eine Hardware-CRC-Einheit ist nun vorhanden. Instruktions-Scheduler und Reorder-Speicher (ROBs) wurden zwischen 30% und 70% vergrößert, um die Out-Of-Order-Befehlsausführung zu verbessern.

Der L2-Cache und seine Schnittstelle zu den CPU-Cores wurden komplett neu entworfen. Es handelt sich um einen 2 MB großen Cache, der aus vier Bänken zu je 512 MB besteht und 16-fach assoziativ ist. Bei Bobcat war der L2-Cache für jeden Core separat vorhanden und nur 512 MB groß. Laut AMD kommt ein einziger, großer Cache, den alle Cores ansprechen können, sowohl Einzelthreadanwendungen als auch Parallelanwendungen zu Gute.
Der L2-Cache von Bobcat lief nur mit der halben CPU-Taktfrequenz. Sein Jaguar-Pendant läuft hingegen mit vollem CPU-Takt, und auch die Prefetch-Einheit wurde verbessert – sie achtet nunmehr auch auf Daten-Musterund kann dadurch zukünftige CPU-Instruktionen mit einer höheren Trefferrate vorab laden. Dem L2-Cache wurden sechzehn Snoop-Einträge hinzugefügt. AMD meint, dass die Verbesserungen des L2-Cache am meisten zum IPC-Vorsprung gegenüber der Bobcat-Architektur beigetragen haben.

Die Schreib-Lese-Einheiten zwischen der Ausführungseinheit und ICache (im Diagramm links oben) sowie DCache (im Diagramm links unten) wurden ebenfalls verbessert, damit die bei den Caches vorgenommenen Performanceverbesserungen auch wirklich der Ausführungseinheit zu Gute kommen. Lesevorgänge werden nunmehr kombiniert und landen in einem größeren Puffer. Der größere Pufferspeicher beschleunigt auch Schreibvorgänge durch Minimierung von Store Data Shuffling.

AMD gibt an, dass diese Designverbesserungen zu einem Performancegewinn von 22% gegenüber Bobcat geführt haben, und zwar bei gleicher Taktrate. Jaguar erlaubt aber auch höhere Taktraten, sodass der wirkliche Performancezuwachs viel höher ausfallen sollte. Wir wollen uns aber nicht auf die Werksangaben verlassen, sondern haben das auch selbst nachgeprüft, wie auf den folgenden Seiten zu lesen ist...
- Temash und Kabini: Die Zukunft von AMD liegt in den Mobilgeräten
- Jaguar: Ein stromsparender x86-Core
- Die ersten APUs mit GCN-Architektur und ihre Stromsparmaßnahmen
- Die neuen AMD APUs der E-Serie und der A-Serie, und die Bündelangebote
- Unsere Benchmarks und der AMD Kabini-Prototyp
- Ergebnisse: Synthetische Benchmarks
- Ergebnisse: F1 2012 und The Elder Scrolls V: Skyrim
- Ergebnisse: Tomb Raider und Metro 2033
- Ergebnisse: Audio- und Videokonvertierung
- Ergebnisse: Adobe CS6 Suite
- Ergebnisse: Büroanwendungen
- Ergebnisse: Dateikomprimierung
- Stromverbrauch
- Die Kabini-APU A4-5000: Mittelmäßige Performance, aber gute Effizienz
Verbaut ist der Temash A6-1450 übrigens schon im „Aspire V5-122P„ vielleicht bekommt ihr mal ein Exemplar zum testen. Auch wenn das Ding leider sehr schlecht implementiert ist (VIEL zu kleiner Akku), und da leider sehr viel liegen lässt. Da wäre ein Laptop mit Tabletlaufzeit zu kleinem Preis möglich gewesen.. Aber vielleicht kommt ja noch was nach.
http://www.computerbase.de/artikel/prozessoren/2013/amd-temash-und-kabini-im-test/
Allerdings finde ich es ein zumindest voreilig, ja sogar ein bisschen unfair, den A4-5000 mit einem Ivy-Bridge Core-i3U zu vergleichen und zu sagen, dass er ist der selben Preisklasse liegt..
Wenn man die Werte des bisherigen AMD E2-2000 als Richtwert hernimmt, dann ist der Intel 50-60,- € teurer. Und das ist gerade im Einsteiger-Segment ziemlich viel "Holz".
Punkto Rechenleistung und Preis wäre wenn, dann schon der 1/3 schneller A6-5200 Kabini der aus meiner Sicht geeignetere Vergleichspartner gewesen.
Klar ist aber auch, dass AMD und Intel beide einen guten Job bei den energiesparsamen CPUs machen und sich gegenseitig wirklich nichts schenken.
Von Preis-Leistungsverhältnis liegen der Kabini und der Ivy-Bridge-U wohl gleich auf, wenn auch mit unterschiedlichen Gewichtungen (AMD wohl preiswerter, Intel schneller).
Aber halten wir mal fest: Pentium B960 unterstützt nur bis DDR3-1333, Core i3-3217U und die Kabni A4 5000 jeweils 1600 DDR3 Ram. Also nur weil der B960 einen Speichercontroller bis 1333Mhz müssen die anderen sich nach unten Anpassen? Die Architekturen sind zudem völlig unterschiedlich und Reagieren dementsprechend. Sowohl die i3 als auch A4 Kabni sollte hier dann mit 1600 getestet werden, dann weiß man was die Architektur auch kann und es wäre fair.
Bei CB erreicht Kabni 1.5 Pkt. im Cinebench, bei euch lediglich 1.11 Pkt., ist nur ein Beispiel, leider benutzt Ihr völlig andere Benchmarks, so dass weitere direkte Gegenüberstellung nicht möglich ist.
Auch CB schaft es die deutliche Verbesserung gegenüber dem Vorgänger (Brazos E2000) zu Erkennen, mit gleichzeitiger Senkung der TDP.
Eine weitere Testseite zeigt ebenso die Stärken von Kabini, diese schlägt sogar in manchen Disziplin die i5 und i7 CPU, auch wenn es die Ausnahme ist. Sorry, aber mich konnte euer Test nicht Überzeugen.
http://techreport.com/review/24856/amd-a4-5000-kabini-apu-reviewed
Man schaue sich Spiele Benchmarks an wo die Quadcore APU Ihre Kerne auch Ausspielen darf und schon sieht sogar die i3 CPU die Rücklichter.
http://techreport.com/review/24856/amd-a4-5000-kabini-apu-reviewed/8
http://techreport.com/review/24856/amd-a4-5000-kabini-apu-reviewed/7
Man sollte schon mehr Differenzieren bei so einen Test und die Benchmarks auch etwas Streuen, und nicht nur die nehmen die nur von 2 Kernen Profitieren, das erwarte ich jedenfalls von einer Fachhardwareseite.
Warum muss man in der Leistungsklasse erstens CPU-fresser wie Skyrim und F1 testen, sowie Grafikfresser wie TR und Metro? Warum nicht noch Crysis3?
Der Test ist kompletter Müll. THG hat ja in letzter Zeit ganz gute Tests abgeliefert, aber das ist Schrott hoch zehn. Die ganzen Schreibfehler ergänzen den erbärmlichen Artikel noch.
Warum nur 1333er Ram? Und warum wird nirgends in diesem Test auf das Singelchannel Speicherinterface hingewiesen?
Bei Kabini, der ein Single-Channel Speicherinterface hat, einfach mal niedriger getakteten RAM zu verwenden (ihr musstet ja den verbauten 1600 Mhz extra ausbauen, oder?), erfordert schon eine Menge Ignoranz (ich unterstelle jetzt mal Unwissen, denn die Alternative wäre böse Absicht). Schon Brazos hängt ja an einem Speicherlimit, bei Kabini hat sich aber die Kernanzahl verdoppelt und die GPU hat deutlich mehr Bums.
Sollte es Unwissen gewesen sein, dann ergänzt doch bitte einfach mal die Werte, die das Gerät mit 1600 Mhz Speicher erreicht. Dann sieht man trotzdem, was bei RAM Gleichstand an Ergebnissen rauskommt und gleichzeitig sieht man aber auch, was der vorliegende Kabini wirklich leisten kann und darum geht´s doch irgendwie oder?
Drum ist es logisch dass ein 15W Kabini deutlich weniger braucht als ein 17W ULV IB wo noch der Chipsatz dazukommt.
Wenn ihr schon CPU's mit deutlich!!!! unterschiedlichen Preisen vergleichen wollt
dann sollte wohl eher der 25W Kabini A6-5200 der Gegner eines 17W ULV IB sein.
Dann dürfte auch der Verbrauch ausgeglichen sein. Und bitte jeweils mit 1600er Ram.
Gibt es bei Tom's Hardware auch einen "Gefällt mir" Knopf?
Würde Ihnen für dieses Statement gerne klicken
Gibt es bei Tom's Hardware auch einen "Gefällt mir" Knopf?
Würde Ihnen für dieses Statement gerne klicken
Danke, normalerweise gibt es das hier. Aber die Seite von TH ist sowieso etwas komisch. Zur Zeit kann ich noch nicht mal Kommentare schicken, vielleicht ist es auch so gewollt?!? Aber kein Thema für mich, nur komische test von "Experten", da kann ich nur mit den Kopf schütteln. Lg