AMD: Weitere Zen-Details auf der Hot Chips

AMD verspricht sich viel von Zen: 40 Prozent mehr IPC-Performance bei gleichzeitig höherer Effizienz sollen die kommenden CPUs bieten.

Cache-seitig verpasst AMD Zen pro Kern zunächst einmal einen 64 Kilobyte großen L1-Instruktions-Cache sowie einen 32 Kilobyte großen Daten-Cache mit Write Back. Hinzu gesellt sich ein 512 Kilobyte großer L2-Cache und ein "großer", gemeinsam geteilter L3-Cache: Während der Präsentation wurde für die Quad-Core-Version der CPU acht Megabyte L3-Cache genannt, dementsprechend höher fällt der L3-Cache bei höherer Kernzahl aus.

Anders ausgedrückt: Ein CPU-Komplex umfasst vier Kerne mit jeweils 64 Kilobyte L1-I-Cache, 32 Kilobyte L1-D-Cache mit Write Back, 512 Kilobyte L2-Cache und 2x 1 Megabyte L3-Cache, wobei der letztgenannte sich jedoch als Shared-Cache für alle Kerne aufsummiert.

Beim L2- wie L3-Cache soll es zudem zu einem deutlichen Bandbreitenzuwachs kommen: Im Vergleich zur Vorgängergeneration spricht AMD von doppelt so viel bei den beiden ersten Level-Caches und sogar fünfmal so viel beim L3.

AMD Zen: Die grundlegende ArchitekturAMD Zen: Die grundlegende Architektur

Hinzu kommt mit dem Micro-op-Cache eine ganz neue Zwischenspeicherart (samt Micro-op-Queue): Hier kann bereits dekodierter Code abgelegt werden, um schneller und ohne erneute Dekodierung nutzbar zu sein.

Für weiteren Performance-Zuwachs soll nicht nur eine verbesserte Sprungvorhersage sorgen, sondern auch eine ganze Reihe neuer Instruktionssätze. Diese sind bei Intels aktuellen CPUs teilweise schon vorhanden, werden aber darüber hinaus bei Zen durch AMD-exklusive Features wie CLZero und PTE Coalescing erweitert.

Zen unterstützt Simultaneous Multitasking. Somit kann jeder Kern zwei Threads bearbeiten (ähnlich wie bei Intels Hyper-Threading) – allerdings weitreichender als das allenfalls partielle SMT der Bulldozer-basierten Architekturen mit ihren Single-Threaded-Integer-Cores. SMT soll für deutlich mehr Durchsatz sorgen.

Zum Stromverbrauch schweigt sich AMD derzeit noch aus, wies allerdings im Rahmen der Präsentation immerhin auf eine ganze Reihe an Optimierungen hin – die aber letztlich genau so wenig über den tatsächlichen Verbrauch aussagen, wie es die Leistungsoptimierungen auf dem Papier über die reale Performance tun können. Hier werden wir einfach noch etwas abwarten müssen.

Ansonsten bietet Zen deutlich mehr Scheduler für Integer- (84 statt 48) und Gleitkommaberechnungen (96 statt 60) als zuvor; gleiches gilt für Retire, Load und Store Queues.

Weitere architekturelle Besonderheiten von AMDs Zen zu Integer- sowie Gleitkommaeinheit und mehr lassen sich auf den folgenden Folien einsehen.

Erstelle einen neuen Thread im News-Forum über dieses Thema
Dieser Thread ist für Kommentare geschlossen
6 Kommentare
Im Forum kommentieren
    Dein Kommentar
  • Plitz
    Folie 2 verwirrt mich ein wenig ... deuten die dort echt an, dass Zen nicht die Geschwindigkeit vom Excavator erreichen wird? Excavator geht immerhin weiter in Richtung "More Performance" als der Zen, also nach rechts! Aber wieso ist die Y Achse auch mit Performance beschriftet?

    Sowohl die X als auch Y Achse sind Performance!

    Bleibt festzuhalten: Excavator bietet mehr Performance als Zen und Zen bietet mehr Performance als Excavator. Genial!
    0
  • echoez
    @Plitz
    Ein weiter Beweiss deiner (im Bezug auf AMD gewollten?) Unfähigkeiten.

    Es ist die gleiche (sehr ähnliche) Folie wie diese von nVIDIA

    Stell Dir links von der GTX 1080 die 1070 und noch ein Stückchen weiter links 1060 vor. Dazu alle jeweils etwas niedriger.
    Recht der 1080 kommt dann Pascal TitanX, ein Stück höher.
    Dann erhälst Du eine Linie, die wie die ZEN-Linie aussieht.

    Zur weiteren Erklärung:
    Die horizontale Achse beschreibt die DIE Grösse/Leistungsaufnahme von klein/niedrig bis gross/hoch

    Somit verbraucht Zen mit kleinerem DIE weniger Strom bei besserer Performance.

    War das jetzt so schwer....?
    0
  • MyRunner
    X = Performanceklasse (Smartphone bis Supercomputer)/Chipflaeche
    Y = Reale Computerleistung der CPU

    Man interpretiert oft, was man sehen will.
    0