Fermi (GT300): Nvidias DirectX-11-Antwort auf den Radeon HD 5870

Eigentlich will Nvidia gar nicht hören, dass die Presse den Nachfolger des GT200-Chips konsequenterweise GT300 tauft. Verständlich ist das schon, denn der Hersteller hat sich entschlossen, das ehemalige Core-Design komplett zu überarbeiten. Der Chip hat den Namen GT300 also nicht verdient, sondern irgendeinen anderen. Der steht dummerweise noch nicht fest. Bis dato spielt ATi seinen DirectX-11-Vorsprung grinsend aus, denn heute wird von Nvidia nur ein Papiertiger vorgestellt, aber kein echtes Produkt.

»Fermi« hat Nvidia die neue GPU vorerst benannt, nach einem der bedeutendsten Kernphysiker des 20. Jahrhunderts, Enrico Fermi. Die GPU hat es in sich: Sie ist in 40-Nanometer-Fertigung hergestellt und verfügt über drei Milliarden Transistoren -- also deutlich mehr als die 2,15 Milliarden des AMD/ATI Radeon HD 5870 (Cypress/RV8xx) und die 2,05 Milliarden des Intel Tukwila. Kompatibel ist die Architektur mit DirectX 11, OpenGL 3.1, OpenCL 1.1 und Cuda 3.0.

512 Shader-Einheiten bietet der Chip, die Nvidia nun in »CUDA Cores« umbenannt hat. Diese Kerne sind aufgeteilt auf 16 Streaming-Prozessoren, so genannte Cluster mit je 32 Cores. Das Speicherinterface ist 384 Bit breit (6 x 64-Bit-Speichercontroller). Fermi unterstützt erstmals GDDR5-Speicher und kann bis zu 6 GByte Grafikspeicher adressieren.

Am ungewöhnlichsten ist jedoch, dass Nvidia diesmal nicht dem Hase-und-Igel-Spiel mit ATi folgt. Während die rot gefärbte, kanadische ATI-Marketing-Maschine ausspielt, dass Nvidia seinen DirectX-11-Chip nur auf dem Papier zu bieten hat und ATi bereits mit echten Produkten aufwarten kann, wirken die Produktmanager des grünen Kalifoniers relativ relaxed. Ferner stellt Nvidia die Ordnung der Produkteinführung auf den Kopf. Seit mehr als 10 Jahren profitierte die Masse der Spieler mit preisgünstigen GeForce-Varianten zuerst. Nunmehr wird der Chip anfangs im teuren Profi-Segment der Quadro-Workstation und Tesla-Anwender eingeführt, erst danach dürfen Spieler mit mit ihren billigen Produkten rechnen.

Eine gewisse Art der Verunsicherung setzt sich bei einem solchen Szenario selbst bei hart-gesottenen THG-Redakteuren ein. Anscheinend muss sich Nvidia seiner Sache wirklich sicher sein, um einen solchen Schritt zu wagen. Grund genug, dass der GPU-Hersteller ATi nervös wird? Kann es sich Nvidia wirklich leisten, mit der Markteinführung zu warten und neben ATi auch noch dem CPU-Hersteller Intel einen vor den Bug zu schießen? Immerhin ist diese "Computational GPU" nicht nur ein Grafikchip im klassischen Sinne sondern verfügt auch über viele CPU-Funktionen, die besonders für den Supercomputing-Bereich geeignet sind.

Nvidia-CEO Jen-Hsung Huang zeigt einen Prototyp der Fermi-KarteNvidia-CEO Jen-Hsung Huang zeigt einen Prototyp der Fermi-KarteTesla-Grafikkarte mit Fermi-GrafikchipTesla-Grafikkarte mit Fermi-Grafikchip

Nvidias Fermi-Spezifikationen im Überblick

Streaming Multiprocessor (SM) der dritten Generation

● 32 CUDA-Kerne pro Streaming Multiprozessor (SM), 4x mehr als GT200
● bei den Spitzenwerten 8 Mal schneller als der GT200 im Bereich der Double Precision Fließkomma-Performance
● Dual Warp Scheduler für 2 Warps mit je 32 Threads pro Taktzyklus
● 64 KB RAM mit frei konfigurierbaren Shared Memory und  L1 Cache

Parallele Thread-Ausführung ISA der zweiten Generation

● Einheitlicher Adressraum mit voller C++ Unterstützung
● optimiert für OpenCL und DirectCompute
● Konform nach IEEE 754-2008 mit voller 32-Bit und 64-Bit-Genauigkeit
● Verbesserte Performance durch Vorhersage

Verbessertes Speicher-Subsystem

● Parallele Datencache-Hierachie mit konfigurierbaren L1- und vereinheitlichten L2-Cache
● Erste GPU mit ECC-Speicherunterstützung
● Deutlich verbesserte Atomic Memory Operation Performance

NVIDIA GigaThread Engine

● 10 Mal schnelleres kontextabhängige Applikationsumschaltung
● Gleichzeitige Kernel-Ausführung
● unabhängige, blockweise Ausführung von Threads
● zwei überlappende Engines für die Datenübertragung

Vorstellung des Nvidia Fermi-Chip (GT300)

GPU G80 GT200 Fermi
Transistorzahl 681 Millionen 1.4 Milliarden 3.0 Milliarden
CUDA-Kerne 128 240 512
Fließkommafähigkeit mit doppelter Genauigkeit keine 30 FMA Operationen / Takt 256 FMA Operationen / Takt
Fließkommafähigkeit mit einfacher Genauigkeit 128 MAD Operationen / Takt 240 MAD Operationen / Takt 512 MAD Operationen / Takt
WARP Schedulers / SM 1 1 2
Besondere Funktionseinheiten (SFUs) /SM 2 2 4
Gemeinsam genutzter Speicher / SM 16 KB 16 KB Konfigurierbar 48 KB oder 16 KB
L1-Cache keiner keiner Konfigurierbar 16 KB oder 48 KB
L2-Cache keiner keiner 768 KB
ECC-Speicherunterstützung keine keine vorhanden
Unabhängig voneinander arbeitende Kernels keine keine Maximal 16

Erste Prototypen des GT300/Fermi wurden im Rahmen des Tapeouts erst Mitte Juli hergestellt. Bei den vorangegangenen Chips benötigte Nvidia meist 6 Monate, bis die Serienfertigung begann. Folgt man diesem Muster, dürfte das Weihnachtsgeschäft nicht mehr zu schaffen sein. Kommt Nvidia erst am Jahresanfang 2010 mit dem Chip heraus, hätte AMD/ATi ein großes Zeitfenster für seine Chips gewonnen.

Erstelle einen neuen Thread im News-Forum über dieses Thema
Dieser Thread ist für Kommentare geschlossen
60 Kommentare
Im Forum kommentieren
    Dein Kommentar
  • zeromaster
    Da sollte ATI mal wieder kein Land sehen *g*
    Beten wir alle für Konkurrenzfähige Preise und ein gutes Gesamtpaket!(Lautstärke etc.)

    Edit: LoL, was geht denn hier? Was ist am Wunsch nach niedrigen Preisen und einem guten Produkt so verkehrt, dass man den Post negativ bewerten muss?^^

    zuviele ATI-Kiddis am Start?
    -11
  • SSense
    Wer weiß, wann das Teil überhaupt kommen soll -.^
    -9
  • crogge
    Das ist Power vom feinsten, wer halbwegs versteht was dort geschrieben ist dann sollte derjenige wissen was für ein großer Schritt dies in der Grafikkarten Technologie ist!

    Gute Arbeit Nvidia, auch für CUDA wird dies eine Interessante Grafikkarte und könnte auch Programme um einen sehr hohen Faktor beschleunigen.
    5