Anmelden mit
Registrieren | Anmelden

Ihre Frage

Frage

Stichwörter:
zyklos http://m.bestofmedia.com/sfp/images/design/noimg/no-profil-100x100.jpg
Newcomer
| in Prozessoren

Optimale Frequenzverhältniss zwischen CPU, Chipsatz u. Arbeitsspeicher

Hallo Leute,

bevor ich cumputa studieren kann wirds noch mind. ein Jahr brauchen und
kann mir deshalb diese Frage nicht selbst beantworten. Und über die lezten Jahre
habe ich keine Antwort im Netz dazu gefunden. Nun bin ich aber neugierig geworden.

Deshalb hoffe ich eine Antwort auf eine sehr einfache Weise, nähmlich hier, zu kriegen,
anstatt englische Bücher zu wälzen und zu assemblieren. Es muss auch nicht 100%-ig richtig
geantwortet werden. Auch Informationen, die ansatzweise dazu passen, helfen mir.

Nähmlich: Wann ist die CPU für den Arbeitsspeicher zu schnell und umgekehrt, um beide Komponenten vollständig auslasten zu können? Wartet die CPU bzw. der Kern nach einem Schreib- oder Lesebefehl an den RAM und tut nix bis der RAM den Befehl ausgeführt hat (Stichwort Busfrequenz, Hyper-Transport, QuickPath Interconnect, RAM-Latenzen u. -Frequenzen)? Erreicht die CPU rein theoretisch ihre Höchstleistung in Bezug zu heutiger Anwender-Software und Server-Anwendungen, wenn der RAM keine Latenzen aufweisen und mit der selben Frequenz, wie der vom L3 Cache, betrieben sein würde? Wo ist aktuell ein Flaschenhals zu sehen? Bei den FSB-Rechnern, war das ja der Chipsatz - und jetzt? Der Arbeitsspeicher? Bringt es was, teurere Arbeitsspeicher und Chipsätze und eine moderate CPU zu kaufen? Ich kann mir nicht vorstellen, dass die Leistung eines Rechners sich annähernd proportional zur CPU-Frequenz verhält. Schließlich sind alle Maschinenbefehle im RAM drinne. Eine CPU mit 20 Ghz und unter 10 MB L3 Cache bringt doch nix mit normalen Arbeitsspeicher und das beispielsweise Ausführen eines Apache Servers oder das Kompilieren eines *nix-Kernels. Lassen wir bitte die persistenten Speicher, wie HDD's u. SSD's, außen vor und stellen uns vor, ein gesamtes Ubuntusystem haust im Arbeitsspeicher. Wie genau arbeitet die CPU mit dem Arbeitsspeicher über den Chipsatz? Ich könnte unendlich Fragen dazu stellen, aber eine (simple) Antwort könnte diese alle beantworten.

Ich wäre sehr dankbar für Information und Wissen im Bereich maschinennahes Programmieren im Singel-Core, Multi-Core, DDR3 und allgemein Serverhardware.
Erfahrungen jeder Art, also auch der von normalen PC-Anwender, sind herzlich willkommen.

Vielen Dank.

Ich hoffe, ich bin im richtigen Forum bzw. Bereich.

Gruß
3
Sie müssen ein registriertes Mitglied sein um abstimmen zu können
  • Teilen
  • Email-Benachrichtungen
  • Zu Favoriten hinzufügen
Werbung stört? Dann Mitgliedskonto eröffnen
Lösungen (7)
Beste Lösung
fragger http://m.bestofmedia.com/sfp/design/usr/de/avatars/26/fd/26412.jpg
Frequent
Grundsätzlich stimmt natürlich, dass der Arbeitsspeicher um Größenordnungen zu langsam ist, um eine heutige CPU zu bedienen, aber die CPU Hersteller haben sich dafür ja aufwendige Cachestrategien und Caches ausgedacht die in ihrer Größe für die allermeisten Aufgaben ausreichend dimensioniert sind. D.h die CPU kann mehr oder weniger ununterbrochen mit voller Geschwindigkeit rechnen.
Das merkt man gut daran, wenn man seinen Arbeitsspeicher massiv übertaktet, das System aber kaum schneller wird. Ergo, der Takt des Arbeitsspeichers ist relativ egal, wenn der Cache gut arbeitet.

Allerdings gibt es Szenarien, wo der Speicherbandbreitenflaschenhals gelegentlich zu Tage tritt. Immer dann, wenn verhältnismässig einfache Rechenoperationen an großen Datenmengen durchgeführt werden sollen (SIMD), kann es sein, dass die Chachgröße zu klein bemessen ist... Bildbearbeitungsalgorithmen an sehr großen Bildern ist ein solches Szenario. Grafikkarten haben dann übrigens das gleiche Problem, aber deren lokaler Speicher ist in der Regel deutlich schneller als der System RAM.
Teilen
Andere Lösungen (6)
Sortieren nach
zyklos http://m.bestofmedia.com/sfp/images/design/noimg/no-profil-100x100.jpg
Newcomer
Gefällt mir
Sie benötigen ein Bronze-Abzeichen in der aktuellen Kategorie, um Beiträge negativ zu bewerten.
Punkte 0
Missfällt mir
Dieser Punktestand spiegelt wieder, wie sehr der Community die Lösung gefällt. Mitglieder können eine Lösung positiv bewerten. Um abzustimmen, loggen Sie sich als registriertes Mitglied ein oder treten Sie der Community bei.
Beste Antwort ausgewählt durch zyklos.
zyklos http://m.bestofmedia.com/sfp/images/design/noimg/no-profil-100x100.jpg
Newcomer
Gefällt mir
Sie benötigen ein Bronze-Abzeichen in der aktuellen Kategorie, um Beiträge negativ zu bewerten.
Punkte 0
Missfällt mir
Dieser Punktestand spiegelt wieder, wie sehr der Community die Lösung gefällt. Mitglieder können eine Lösung positiv bewerten. Um abzustimmen, loggen Sie sich als registriertes Mitglied ein oder treten Sie der Community bei.
Zitat :
Beim Core2 ist es zumindest so das es die CPU nicht kratzt ob Daten mehrfach im Cache liegen. Also gleichzeitig im L1 und L2. Dafür haben diese CPUs genug Hubraum.
Ist das bei den Core i CPUs auch noch so?


Die i Cores müssten noch eine ähnliche Cachestrategie wie die der core2dou, also die "aggressivere" als die von AMD angewandte Technik, implementiert haben. Hab das vor einem gut halben Jahr im Netz gelesen.

Also sind die CPUs nun die "Flaschenhälse". Dann werd ich mir wohl demnächst ne Wasserkühlung einbauen um meine CPU per cool'n'quit oc auf 4 Ghz zu bringen.

http://forums.amd.com/forum/messageview.cfm?catid=401&t...
http://forums.amd.com/forum/messageview.cfm?catid=318&t...

RAM-Riegel zu optimieren oder das Kaufen von schnelleren RAMSs kann man wohl vernachlässigen, da, wie fragger schon sagte, die CPU per Caching-Methoden sich selbst quasi mit Daten vollstopfen könnte - egal, ob der RAM mit 1333, 1600 oder sogar 2133 Mhz läuft.

Nun hab ichs verstanden. Vielen Dank :bounce: 
avaka http://m.bestofmedia.com/sfp/images/design/noimg/no-profil-100x100.jpg
Veteran
Gefällt mir
Sie benötigen ein Bronze-Abzeichen in der aktuellen Kategorie, um Beiträge negativ zu bewerten.
Punkte 0
Missfällt mir
Dieser Punktestand spiegelt wieder, wie sehr der Community die Lösung gefällt. Mitglieder können eine Lösung positiv bewerten. Um abzustimmen, loggen Sie sich als registriertes Mitglied ein oder treten Sie der Community bei.
Bei der Cachesache liegt z.b. auch einer der gewaltigen Unterschiede zwischen AMD und Intel.
Beim Core2 ist es zumindest so das es die CPU nicht kratzt ob Daten mehrfach im Cache liegen. Also gleichzeitig im L1 und L2. Dafür haben diese CPUs genug Hubraum.
Ist das bei den Core i CPUs auch noch so?

Bei AMD darf das jedenfalls nicht sein. Da werden wenn es nötig ist lieber Bits und Bytes im Cache hin und her geschibbelt bis im L1, L2 und L3 Daten nur einmal vorliegen. Das spart Cache (Transistoren -->teuer) führt aber im ungünstigen Fall zu gewaltigem Verwaltungsaufwand, wenn Core 3 aus dem L1 von Core 0 mal was haben möchte. Dafür darf man bei AMD aber auch von 8MB Cache im Falle der großen Phenom II reden. Zumindest besteht AMD immer darauf wenn die Sprache auf die verhältnismäßig mickrigen Einzelstufen kommt.

Beim RAM ist es heute wirklich fast latte. Ich hab DDR2 800 drinne, die gleiche CPU stemmt aber auch DDR3 1333 (AM3) und mit was Einstellen lief sogar DDR3 1600. Merken würde ich es in Spielen wahrscheinlich nicht welcher Speicher steckt wenn ich es nicht wüsste.

Interessant ist auch, dass der RAM auf dem Mainboard selbst, also die kleinen schwarzen Chips innen drin, immer noch mit 100 oder 133MHz krebsen. Das was heute als 1600MHz verkauft wird ist nix anderes als ein Multiplikator für den BUS. Die letzte echte Errungenschaft war DDR, danach kam nicht mehr viel. Deshalb sitzen wir ja auch auf so monströsen Cachehaufen von CPUs, weil man das seit Jahren zu kompensieren versucht.

puri http://m.bestofmedia.com/sfp/images/design/noimg/no-profil-100x100.jpg
Veteran
Gefällt mir
Sie benötigen ein Bronze-Abzeichen in der aktuellen Kategorie, um Beiträge negativ zu bewerten.
Punkte 0
Missfällt mir
Dieser Punktestand spiegelt wieder, wie sehr der Community die Lösung gefällt. Mitglieder können eine Lösung positiv bewerten. Um abzustimmen, loggen Sie sich als registriertes Mitglied ein oder treten Sie der Community bei.
Ich denke, die Flaschenhälse hängen davon ab, was Du verarbeiten möchtest. Es gibt ja die Speicherhirachie und darin wieder die Cachehirarchie.
Wenn Du es schaffst ein Mini-ASM-Programm komplett im L1-Cache der CPU ablaufen zu lassen, wirst Du die maximal mögliche Geschwindigkeit des Prozessors sehen, da der L1-Cache meist identisch schnell wie der Prozessor selbst getaktet ist. Sobald Du die Cachehirarchie weiter nach unten gehst (L2, L3) wird die Verarbeitungsgeschwindigkeit immer langsamer, Takt, Zugriffszeit der Caches und Cachesharing der Cores spielen da eine Rolle. Der erste große Sprung dürfte der vom L3-Cache auf den Hauptspeicher sein, der nächste große Sprung vom Hauptspeicher auf Massenspeicher-
zyklos http://m.bestofmedia.com/sfp/images/design/noimg/no-profil-100x100.jpg
Newcomer
Gefällt mir
Sie benötigen ein Bronze-Abzeichen in der aktuellen Kategorie, um Beiträge negativ zu bewerten.
Punkte 0
Missfällt mir
Dieser Punktestand spiegelt wieder, wie sehr der Community die Lösung gefällt. Mitglieder können eine Lösung positiv bewerten. Um abzustimmen, loggen Sie sich als registriertes Mitglied ein oder treten Sie der Community bei.
Danke für deine Antwort.

Ich dachte vorher, dass der Arbeitsspeicher der Flaschenhals wäre, weil die CPU ja um ein so faches schneller ist (Beispiel Phenom 2 X4 995 3,4 Ghz versus DDR3 12800 (1600Mhz effektiv - 200 Mhz Speichertakt) Dualchannel). Aber wie es aussieht lässt sich mit Daten ziemlich viel herumrechnen XD

Leider weiß ich auch nicht genau, wie viel eine CPU sich durchschnittlich mit einen Datensatz im RAM (Befehl) beschäftigen kann, sodass keine Milchmädchen-Rechnung aufgestellt werden kann, die aussagt, ab welchem Ghz CPU-Takt ca. der RAM der Flaschenhals wird. Das wäre nähmlich für mich sehr interressant zu wissen :pt1cable: 

Zitat :


Zitat :

Wie genau arbeitet die CPU mit dem Arbeitsspeicher über den Chipsatz?


hier mal ein Beispiel für Intel:
X58: http://www.intel.com/Assets/Image/ [...] iagram.gif
X48: http://www.intel.com/assets/image/ [...] iagram.jpg


Der Aufbau der Core2Dou, i7 und Phenom 2 -Architekturen kenne ich ja. Ich meinte eher auf Bit bzw. Byte (32 - 64 bit) -Ebene bezogen.
Schade, dass es nur einer geantwortet hast. Aber trotzdem Danke. Vielleicht meldet sich auch noch einer :) 

Nachtrag: Die CPUs der i7, i5 und generell alle AMD CPUs nach der Athlon XP-Serie können ja nun direkt mit dem Arbeitsspeicher kommunizieren. Über den Chipsatz passiert ja im diesen Fall nix.

Gruß
zyklos
TNC-Flipstar http://m.bestofmedia.com/sfp/design/usr/de/avatars/73/6a/35114.jpg
Experte in Prozessoren
Moderator bronze-Mitglied
Gefällt mir
Sie benötigen ein Bronze-Abzeichen in der aktuellen Kategorie, um Beiträge negativ zu bewerten.
Punkte 0
Missfällt mir
Dieser Punktestand spiegelt wieder, wie sehr der Community die Lösung gefällt. Mitglieder können eine Lösung positiv bewerten. Um abzustimmen, loggen Sie sich als registriertes Mitglied ein oder treten Sie der Community bei.
Hey !
Ich teile dir mal das mit was ich dazu so weiß.

Der Arbeitsspeicher ist schnell genug um alles zuverarbeiten, die Latenzen haben eigentlich nur einen vorteil beim OC, ansonsten ist der Leistungsgewinn dadurch nur minimal messbar, beim Sockel 775 wird der FSB gerne mal zum Flaschenhals, bei gleicher CPU Taktung (3,4GHz) hab ich eine bessere Leistung wenn ich einen FSB von 450MHz(*7,5) verwende anstatt einen von 400MHz(*8,5), das kommt bei mir auch zum Teil vom großen Cache (Q9550).

Das Problem wurde bei den neueren Sockeln jetzt behoben, nur ein erhöter CPU-Takt bingt mehr Leistung, eine Steigerung vom HT Takt hat keine positiven Auswirkungen, teils eher negativ und auch hier ist der RAM mehr als schnell genug, die Rams mit 2000MHz und mehr sind entweder für Extreme OC versuche, zum teil ist das auch alles Maketing um den Leute die Kohle aus der Tasche zuziehen.

Ab gewissen Taktraten steigt je nach CPU die Leistung nicht mehr stak an, bzw. die Wärmeentwirklich wird zu stark bis 4 GHz geht das eigentlich mit den aktuellen CPUs, beim Phenom 9950 ist es z.b. ab 3GHz sinnlos, ab dann steigt der Verbrauch zustark an.
Es gibt auch Modelle bei den man keine 4GHz erreicht und wiederrum andere die mehr schaffen, das ist halt die Praxis in der Produktion.

Beim Sockel 775 reicht es vollkommen wenn der RAM 1:1 zum Takt des FSB läuft, eine höhere Taktung bringt nicht mehr, bzw. nur minimal messbare Unterschiede, allerdings gibts den Sockel auch mit DDR3 RAM und da ich ich mit meinem jetztigen RAM der mit 1333MHz getaktet ist ab einem FSB von 460MHz Probleme, das mag der nicht ich werd es nochmal mit RAM testen der mit 1600MHz angegen ist und mal schauen wie sich das dann verhält.

Bei aktuellen CPU mit Standarttakt ist DRR3 1333Mhz ausreichend, beim OC hat der 1600MHz Speicher halt so seine Vorzüge.
Zitat :
Wie genau arbeitet die CPU mit dem Arbeitsspeicher über den Chipsatz?

hier mal ein Beispiel für Intel:
X58: http://www.intel.com/Assets/Image/diagram/X58_blockdiag...
X48: http://www.intel.com/assets/image/diagram/x48_block_dia...

Ich selber hab grad nur Intel laufen, deswegen kann ich dir dazu mehr Informationen geben, aber bei AMD weiß ich das die erhöhung vom HT-Takt etwas mehr Leistung bringt, aber wie genau das mein Aktuellen ist weiß ich auch nicht genau.
Werbung stört? Dann Mitgliedskonto eröffnen
Neue Frage
nicht verbunden
Sie sind noch nicht eingeloggt. Login oder Registrieren