Phenom-Zukunft: Wie gut skaliert der Quad-Core mit steigendem Takt?
Inhaltsverzeichnis
- 1. Wird Phenom von steigenden Taktraten profitieren?
- 2. Ein wenig Prozessor-Geschichte
- 3. Athlon 64 X2 mit 2,2 GHz, 2,4 GHz, 2,6 GHz und 2,8 GHz
- 4. Phenom 9000 mit 2,2 GHz, 2,4 GHz, 2,6 GHz und 2,8 GHz
- 5. Testkonfiguration und Benchmark-Setup
- 6. Ergebnisse: Spiele-Benchmarks
- 7. Ergebnisse: Spiele-Benchmarks, Fortsetzung
- 8. Ergebnisse: Audio-Benchmarks
- 9. Ergebnisse: Video-Benchmarks
- 10. Ergebnisse: Anwendungs-Benchmarks
- 11. Ergebnisse: Anwendungs-Benchmarks, Fortsetzung
- 12. Ergebnisse: Synthetische Benchmarks
- 13. Ergebnisse: Synthetische Benchmarks, Fortsetzung
- 14. Ergebnisse: Windows Vista Experience Index
- 15. Fazit: Phenom lebt von seinen Kernen
Als wir vergangenen Monat den Athlon 64 X2 von AMD mit dem neuen Phenom 9000 Vierkern-Prozessor verglichen zwangen wir Windows, nur einen einzelnen Prozessorkern zu benutzen; auf diese Weise wollten wir herausfinden, wie groß der Leistungsunterschied zwischen der AMD64- und der Stars-Architektur des Agena/Barcelona-Prozessorkerns wirklich ist. Die Ergebnisse haben gezeigt, dass der Phenom in einem direkten Vergleich auf Basis einer CPU-Einheit Dank all seiner Optimierungen und des L3-Caches tatsächlich bis zu 20% schneller ist als der Athlon. Auf diesen Leistungszuwachs sollten durch das moderne Vierkern-Design und der intelligenten Cache-Architektur des Phenom unter Thread-intensiven Bedingungen weitere Vorteile folgen. Details zur Leistungsfähigkeit beim Einsatz aller vier Prozessorkerne finden Sie mehr in unserem Artikel ”AMD Phenom: Megatest aller CPUs”. Alle Benchmark-Ergebnisse und einen Vergleich mit den Core-2-Prozessoren gibt es in unseren CPU–Charts. Doch zurück zum heutigen Vergleich: Phenom gegen Athlon, jeweils mit nur einem Prozessorkern, aber bei 2,2, 2,4, 2,6 und 2,8 GHz Takt. Kann sich der Phenom weiter absetzen?
Der direkte Vergleich beider Prozessorkerne hat uns über alle herkömmlichen Benchmarks hinweg interessante Ergebnisse zur Leistung der überarbeiteten Architektur geliefert, blieb uns allerdings eine Antwort schuldig. Die dürfte wiederum von größerer Bedeutung sein, sobald der Phenom endlich seine TLB-Krankheiten auskuriert hat (korrigierter TLB-Bug im B3-Stepping) und das Unternehmen die CPU in größerer Anzahl und vor allem auch mit höheren Taktraten anbieten kann: Profitiert der Phenom-Vierkern von höheren Taktraten genug, um es wieder mit Intel aufnehmen zu können? Mit anderen Worten: Sind die Leistungszuwächse aufgrund höherer Taktraten größer als als ähnlich geartete Taktratensteigerungen bei einem Athlon 64 X2? Ab welcher Taktrate wird dann wohl Leistungsaufnahme zum Problem?
Natürlich wollten wir Antworten und haben uns dafür wieder das bereits verwendete Testsystem geschnappt: Ein Asus M3A32 MVP mit einem 790FX-Chipsatz von AMD, ein Athlon 64 X2 6000+ Prozessor, unser Testexemplar Phenom 9000 (ohne Multiplikator-Sperren), zwei 1 GB DDR2-800 DIMMs von Corsair, unsere Referenzfestplatte von Western Digital und die Radeon HD3850-Grafikkarte von Gigabyte. Um herauszufinden, wie sich eine höhere Taktrate in zunehmender Leistung ausdrückt, haben wir beide Prozessoren mit Taktraten von 2,2 , 2,4 , 2,6 und 2,8 GHz betrieben und die Ergebnisse zusätzlich auf 2,2 GHz normalisiert (100%).
- Hardware,
- AMD ,
- Phenom ,
- Skalierung
- 1 / 2
- Weiter
-
Neueste Prozessoren News
Neueste Prozessoren Testberichte
- 21/05 – Testbericht AMD A10-4600M: Trinity gibt sein Debüt, mobil
- 26/04 – Ivy, so trügerisch: Core i7-3770K übertaktet
- 23/04 – Intel Core i7-3770K im Test: Wie Sandy Bridge, nur etwas mehr
- 27/02 – OpenCL in Aktion: Programme zur Videonachbearbeitung...
- 13/02 – Gaming-CPUs unter 175€: FX, APU oder Pentium?


Ich kann die Ergebnisse nicht ganz nachvollziehen.
Hab selbst einen "umfangreichen" Test zwischen K8 und K10 gemacht (+unterschiedliche Anzahl an Cores & vgl zu Intel Cores) und festgestellt das K10 sehrwohl schneller arbeitet als K8 trotz niedriegerer Tacktung.
K10 profitiert hier sehr von der überarbeiteten FPU.
http://amor.cms.hu-berlin.de/~chec [...] ei=CPU-sum
Ich kann die Ergebnisse nicht ganz nachvollziehen.
Hab selbst einen "umfangreichen" Test zwischen K8 und K10 gemacht (+unterschiedliche Anzahl an Cores & vgl zu Intel Cores) und festgestellt das K10 sehrwohl schneller arbeitet als K8 trotz niedriegerer Tacktung.
K10 profitiert hier sehr von der überarbeiteten FPU.
http://amor.cms.hu-berlin.de/~chec [...] ei=CPU-sum
Check ich das nicht, oder sind die Farben in jedem Diagramm einfach komplett vertauscht?!
hmm... ich hab mir den test nich vollständig angesehen und nur mal durch die (normalisierten) benchmarks geblättert, sehe aber da ein vergleichbares steigerungspotential mit dem takt.
lediglich der memory controller scheint beim Phenom (noch?) etwas weniger steigerungspotential mit takt zu besitzen - wenn man das berücksichtigt, steigert sich die rechenleistung durchaus stärker mit dem takt als beim A64X2.
natürlich muss man das als einheit betrachten, in wie weit hier jedoch noch nachgebessert werden kann bzw wie sehr der speichercontroller trotz anderer vernachlässigter kerne nicht auf 4 kern betrieb optimiert wurde, lässt sich anhand dieses tests kaum sagen.
oder ich versteh da was falsch...
hmm... hätte nicht gedacht, daß ein Starskern schlechter mir dem Takt skaliert als ein "alter" Kern. Man sollte aber bedenken, daß die neue Architektur viele neue Vorteile gegenüber der alten bringt. Mag ja sein, daß AMD einige der Features mit der Skalierung der Taktrate erkauft hat. Andererseits sollte man auch bedenken, daß die neue Architektur evtl. bei mehr als 2 Kernen vielleicht besser skaliert als die alte. In diesem Fall wäre es von AMD vollkommen berechtigt solche Veränderungen vorzunehmen. Mal sehen was AMD in Zukunft noch für Prozessoren rausbringt.
der Test ist vollkommen für den A****.. wenn ich den Takt der CPU erhöhe, erhöht sich die Rechenleistung direkt linear. Eine Erhöhung des Taktes von 2.2GHz auf 2.8GHz sind 27,3% Mehrleistung. Alle benchmarks, die ausschließlich die Rechenleistung der CPUs untersuchen, stellen auch genau das fest
(synhetische Benchmarks -> PC Mark 05 CPU Test, Sandra CPU Test, etc..)
Alles was der Test aussagt, ist das der Memory-Controller vom Phenom schlecht mit dem Takt skaliert - woran das auch immer liegen mag. Über die Architektur sagt das imho aber nichts aus, das kann noch an viel mehr liegen als nur am Prozessor...
Das skalieren des Speicherdurchsatzes beim 600+ verwirrt mich etwas. Der Speichertakt ergibt sich bei AM"-CPUs aus CPU-Takt/Speicherteiler. Somit ist nur bei 2,4 und 2,8GHz ein Speichertakt von 400MHz möglich. Bei 2,6 sind es 375MHz und bei 2,2 sogar nur 367MHz. Demnach müsste bei 2,4 und bei 2,8GHz der Speicherdurchsatz am höchsten sein.
Und zum Phenom, dieser besitzt ja 2 Singlechannel-Speichercontroller. Kann es sein, das ein Kern nicht beide gleichzeitig ansprechen kann? Das würde zumindest den geringeren Speicherdurchsatz erklären.
Die Benchmarks zeigen ja ganz gut welchen einfluss der L3 Cache hat. Bei höherem Takt verringert sich der Vorteil durch den L3 Cache. Bei Anwendungen die nicht vom L3 Cache profitieren skalieren beide CPUs etwa gleich gut.
Die Ergebnisse dieses Artikels beschreibend, meint ihr:
Ihr habt doch im neueren Artikel nur die Skalierung verglichen und nicht die Leistung der Einzelkerne an sich. So gesehen hat der von mir anfangs zitierte Satz ueberhaupt keinen Bezug zum aktuellen Artikel, war doch der Prescott im Schnitt tatsaechlich nicht schneller ein gleich getakteter Northwood.
Ihr koenntet natuerlich auch noch einen "Phenom vs Athlon: Doppelkern gegen Doppelkern"-Artikel schreiben. Aber auch der wuerde keine neuen Erkenntnisse bringen. Das man mit Multicore-Designs Skalierungsnachteile
in Kauf nehmen muss, ist ein alter Hut. Und das haette man auch so darstellen koennen fuer die, denen das noch nicht bekannt ist.
Skalierungsnachteile koennen natuerlich durch Verbesserung des Kern-Designs wettgemacht werden, aber das passiert leider eher selten, denn die Nachteile an sich skalieren sehr gut mit der Anzahl der Kerne.
Warum steht in der Testkonfiguration als Grafikkarte "Gigabyte Radeon HD 3850 GV-RX385512H GPU: 670 MHz Speicher: 512 MB DDR3 (830 MHz, 256 Bit)", in den Spiele Benchmarks aber GF 8800 GTX 768MB?
@thg
was ist denn das für ein fazit?
der querverweis auf den p4 ist schlichtweg absurd!
@procarion
danke für diesen fachkompetenten beitrag, der uns diesmal an erster stelle erspart blieb..
@hoffy: Ich vermute, Du hast recht. Auch ich glaube, dass die Farb-Legende bei SÄMTLICHEN Grafiken verkehrt ist.
An die THG-Crew: der disKordianer hat da einen sehr interessanten Aspekt vorgebracht. Bitte macht doch mal die synthetischen Speicher-Benchmarks mit nur einem Speicherriegel. Sollte sein Verdacht wirklich stimmen, wären die Ergebnisse sämtlicher RL-App-Benchmarks ein Fall für die Rundablage. *dump*
Mal eine ganz einfache Frage: Gab es von irgendjemandem mal einen Absturz des Phenom (wegen dem TLB Bug)? Meiner Meinung nach duerfte der Fehler nur dann zu Tage treten wenn die Pagetables im 2. Stage unterschiedliche Eintraege besitzen, Sprich nur beim Einsatz eines Hypervisor, denn nur dann wird der 2. Level (den der TLB absicher) ueberhaupt benutzt. Oder anders ausgedrueckt: In Ermangelung eines Hypervisor auf normalen Systemen KANN der Fehler gar nicht auftreten. Kann mir jemand was gegenteiliges berichten?
@Wumba: Im PAE Modus wird auch eine dreistufige Pagetable verwendet. Unter 64-Bit Windows sogar vierstufig:
http://de.wikipedia.org/wiki/Virtu [...] #Beispiele
@thg: Der 3rd Level Cache ist ZUSÄTZLICH zwischen Ram und 2nd Level Cache eingeschoben. Schämtliche Verwaltungsarbeit BREMST die Gesamtperformance auf einem SingleCore System (Bsp WriteBack + CacheMiss: Ein Lesezugriff führt zu einem Schreib- und dem eigentlichen Lesezugriff). Der 3rd Level Cache ist aber nicht groß genug um diesen Nachteil in einem Vorteil aufgrund seiner Größe zu münzen (-> seit PowerPC schon bekannt). TROTZDEM hat man sich für einen 3rd Level Cache entschieden, weil er die Skalierung mit zunehmender Kernanzahl unterstützt.
ERGO Test hätte sein müssen: Nicht Skalierung pro Takt sondern Skalierung pro Kern! Hier hätte man X2 vs. Phenom rennen lassen können mit 2 Kernen und dann auch Phenom 4 Kerne gegen Core 2 Quad jeweils normiert auf deren Leistung. Da wäre der 3rd Level Cache positiv zum Tragen gekommen.
@EDIT Wenn man Core2 und X2 ins Spiel bringt, darf man aber nicht vergessen, dass Core2 schon einen shared 2nd Level bringt und X2 exclusive Caches pro Kern.
http://amor.cms.hu-berlin.de/~chec [...] ei=CPU-sum
Dieser Link von der ersten Seite ist doch wohl für die Tonne! Hast du dir das eben als PDF zusammengeschrieben? Ein Core2Duo ist im Gamebenchmark langsamer als ein P4 oder Pentium D?
Mein Gott, lächerlicher kann man sich wirklich nicht machen...
der Test ist vollkommen für den A****.. wenn ich den Takt der CPU erhöhe, erhöht sich die Rechenleistung direkt linear. Eine Erhöhung des Taktes von 2.2GHz auf 2.8GHz sind 27,3% Mehrleistung. Alle benchmarks, die ausschließlich die Rechenleistung der CPUs untersuchen, stellen auch genau das fest (synhetische Benchmarks -> PC Mark 05 CPU Test, Sandra CPU Test, etc..)Alles was der Test aussagt, ist das der Memory-Controller vom Phenom schlecht mit dem Takt skaliert - woran das auch immer liegen mag. Über die Architektur sagt das imho aber nichts aus, das kann noch an viel mehr liegen als nur am Prozessor...
Die Skalierung der Speichergeschwindigkeit ist so zu erklären:
x2: nur 1 pll, d.h. wenn der prozessor einen höeren takt fährt ist auch der speicher-controller (damit meine ich nicht den speichertakt) schneller und kann mehr anfragen verarbeiten. deshalb skaliert der dual-channel nicht mit faktor 2 weil ihm einfach die puste ausgeht (gilt auch für intel-basierte chipsätze).
phenom: speicher-controller hat einen eigenen pll, somit ist dieser unabhängig vom prozessortakt (vermutlich 1800 mhz).
pll --> multi. vom referenztakt (200 mhz), jeder kern, speichertakt, speichercontroller incl l3 und ht (entschuldigt,wenn ich einen vergessen) besitzt einen eigenen, somit sind die taktfrequenzen sychron aber unabhängig z.b. 200 mhz*2,66 ergeben 533 MHz ddr1066 für den speicher.
an thq: die phenom speichergeschwindigkeit kann mit dem prozessortakt nur sehr gering skalieren
Der Triplecore wurde von AMD auf 8000 umgetauft!
>> Wir müssen dabei auch betonen, dass wir die BIOS-Version 0603
>> von Asus verwendet haben, die die TLB-Probleme des Phenom noch
>> nicht behebt. Deshalb wurde der Phenom ohne jegliche
>> Leistungseinschränkung betrieben.
Entweder Ihr habt kein TLB-fix im BIOS, dann habt Ihr Fehler ion den Anwendungen insbesondere bei hohen Frequenzen (das ist doch gerade das Problem beim/die Eigenschaft des TLB). Ergo ist das Ergebnis nicht repräsentativ. Oder aber Ihr habt ein TLB-Fix, d.h. weniger Leistung und dann ist das Ergebnis der Anwendung richtig bzw. auch korrekt gemessen. Ergo ist das Ergebnis nicht repräsentativ. Sucht es Euch aus...
@ ankabo
> Ein Core2Duo ist im Gamebenchmark > langsamer als ein P4 oder Pentium D?
1. Das ist kein Gamebenchmark, das ist ein Gamess-Benchmark .. Das ist ein Quantenchemisches Programm, das extrem viele Fließkommazahloperationen durchführt.
2. Die Werte geben wie in der Tabelle angemerkt die Dauer der Berechnung an. Also ist ein Core2Duo mit niedriegerer Zahl schneller mit einer Rechnung fertig geworden, als ein PentiumD usw.
> Mein Gott, lächerlicher kann man sich wirklich nicht machen...
Da stimme ich dir zu. Wer liest ist im Vorteil.