www.Au-Ja.de - http://www.au-ja.de/review-intelcore2duo-print.phtml
Intel Core2 Duo und Core2 Extreme - 1/18
24.07.2006 by doelf
Zur HTML-Ansicht
Nur noch wenige Tage und Intel wird seine Core2 Duo und Core2 Extreme Prozessoren offiziell vorstellen und noch vor der offiziellen Markteinführung am 27. Juli ist die Berichtsperre gefallen. Auch wir wollen unseren Testbericht noch vor dem Verkaufsstart präsentieren, denn Intels Core Mikroarchitektur ist ohne Übertreibung wegweisend.
Dabei kommt Intels Core Mikroarchitektur keinesfalls überraschend: Bereits im Frühjahr 2004 stellte der Chipgigant die Weichen für den jetzt vollzogenen Kurswechsel, dessen Grundkonzept vorsah, die Mobil- und Desktop-Prozessoren wieder in Form einer einzelnen Architektur zu vereinen. Doch wie kam es zu diesem Schritt und worin liegen die Vorteile? Da die Wurzeln der Core Mikroarchitektur beim Pentium III liegen, müssen wir zunächst einmal zurück ins Jahr 2000.
Vom Pentium III zur Netburst Architektur
Als Intel den Pentium III Prozessor Ende 2000 mit der Netburst Architektur, also dem Pentium 4, ablöste, hatten die Entwickler die neue CPU-Generation vor allem auf das Erreichen hoher Taktraten ausgelegt. Besonders effektiv arbeiteten die ersten Pentium 4 Prozessoren im Sockel 423 zunächst allerings nicht, da sein L2-Cache mit 256 KB sehr knapp bemessen war und die geringen Taktraten von 1,3 bis 1,5 GHz die Nachteile der langen Pipeline noch nicht kompensieren konnten. Dennoch war der Wechsel notwendig, wie kurze Zeit zuvor die Rückrufaktion des Pentium III (Coppermine) mit 1,13 GHz gezeigt hatte: Mit den damaligen technischen Mitteln hatte der Pentium III die Grenzen seiner Architektur erreicht (und überschritten) und dem AMD Athlon nicht mehr viel entgegenzustellen.

Sockel 478 - links: Northwood; rechts: Prescott
Sockel 478 und HyperThreading
Nach dem schleppenden Start des Pentium 4 mit Willamette Kern (180 nm) im Sockel 423 und 478 entwickelte sich der Nachfolger Northwood mit einem doppelt so großen L2-Cache (512 KB) zu einem echten Erfolgsmodell. Insbesondere die HyperThreading Technologie machte den Pentium 4 attraktiv. Hierbei sorgen parallel arbeitende Pipeline-Stufen sowie eine komplexe Steuerungstechnik für eine bessere Auslastung der CPU. Eine CPU mit HyperThreading Technologie hat zwar nur einen physikalischen CPU-Kern, durch die interne Parallelisierung verfügt sie jedoch über zwei logische CPU-Kerne. Auch wenn diese Methode nicht an die Leistung eines echten Dual-Core Prozessors herankommt, vermochte sie die Nachteile der extrem langen Pipelines der Netburst Architektur gut zu kompensieren.

Entwicklungsstufen der Netburst Architektur
Sockel LGA775 und 4 GHz im Visier
Innerhalb kurzer Zeit steigerte Intel den Takt der Northwood Prozessoren von 1,6 auf letztendlich 3,4 GHz und es schien, als wäre die 4 GHz Grenze bereits in greifbarer Nähe, doch solch hohe Taktraten gab der im 130 nm Prozess gefertigte Northwood dann doch nicht zuverlässig her. Der Wechsel zur 90 nm Fertigung sollte Netburst die Zukunft sichern, doch der Prescott entpuppte sich als Problemfall: Die Prescott Prozessoren verbrauchte deutlich mehr Strom als AMDs Athlon 64 Architektur und wurden dabei auch deutlich heißer. Auch der Wechsel vom Sockel 478 zum LGA775 sollte an diesem Problem nichts ändern. Luftschläuche (Airducts) sollten in OEM-PCs eine ausreichende Kühlung sicherstellen, doch gerade das damalige Spitzenmodell Pentium 560 mit 3,6 GHz ließ sich nur mit lautstarken Lüftern im Zaum halten. AMD spielte zeitgleich mit Cool'n'Quiet eine Trumpfkarte aus, die den Texanern in allen Marktsegmenten neue Kunden gewinnen konnte.

Der Sockel LGA775: Intels Prozessoren verlieren ihre Beine!
Dual-Core und 65 nm
Mit den im 90 nm Fertigungsprozess hergestellten Smithfield Kernen stellte Intel seine ersten Dual-Core Prozessoren für den Desktop-Markt vor, dabei sollte die Enhanced Intel SpeedStep-Technologie (EIST) den Stromhunger des "doppelten Prescott" zügeln, was allerdings mehr schlecht als recht gelang. Mit dem Prescott 2M kam zudem eine Single-Core Variante mit 2 MByte L2-Cache auf den Markt, welche ebenfalls EIST beherrscht. Intel legte die untere Taktgrenze auf 2,8 GHz fest, aus diesem Grund verfügen weder der Pentium D 820 noch der D 805 über EIST. Die beiden Kerne des Smithfield verfügen über jeweils 1 MByte L2-Cache.
Die letzte Ausbaustufe der Netburst Architektur ist der Presler Kern, der im 65 nm Prozess gefertigt wird und 2 MByte L2-Cache pro Kern bietet. Die Schwestermodelle mit nur einem Kern tragen den Codenamen "Cedar Mill". Leider hat Intel die Energiespartechnik EIST in der B1 Revision der 65 nm Kerne fehlerhaft implementiert, mit einer Thermal Design Power (TDP) von 130 Watt ist das derzeitige Spitzenmodell Pentium D 960 allerdings sowieso wieder sehr stromdurstig. In Hinblick auf die Funktionen ist Intels Virtualisierungstechnologie neu hinzugekommen.

Intels Virtualisierungstechnologie
Extreme Maßnahmen
Sechs Jahre, drei Sockel (423, 478 und LGA775) und schier unzählige Modelle zeigen, daß die Netburst Architektur trotz ihrer Schwächen sehr erfolgreich war. Doch um im Duell mit AMD um die Leistungsspitze mithalten zu können, führte Intel ein Spitzenmodell ein, welches zunächst Pentium 4 Extreme Edition und später Pentium Extreme Edition hieß. War die erste Version des EE mit Gallatin Kern in Wahrheit ein Xeon Prozessor mit 2 MByte L3-Cache, so setzte Intel bei späteren Modellen auf einen schnelleren Frontsidebus mit 1066 MHz. Als die ersten Dual-Core CPUs auf den Markt kamen, bot der Pentium Extreme Edition nicht nur zwei Kerne, sondern dank aktivierter HyperThreading Technologie zwei physikalische Kerne mit je zwei logischen Kernen. Wegen des hohen Preises von knapp 1000 US-Dollar blieben diese Prozessoren aber immer eine Randerscheinung und seien hier nur der Vollständigkeit halber erwähnt.
Intel Core2 Duo und Core2 Extreme - 2/18
24.07.2006 by doelf
Zur HTML-Ansicht
Der Pentium M
Doch halt: Während die Netburst Architektur aufgrund des ausufernden Stromverbrauchs und der immensen Hitzeentwicklung an der 4 GHz Grenze scheiterte, zeigte Intels Pentium M, daß es auch deutlich effizienter geht. Der Pentium M ist keine Netburst CPU sondern basiert auf dem Pentium III. Allerdings erweitert er diesen um SSE2, EIST sowie ein mit dem Pentium 4 kompatibles Businterface. Die Entwicklung des Pentium M ist eine direkte Folge der ineffizienten Netburst Architektur, denn bei mobilen Geräten, die auf lange Akkulaufzeiten angewiesen sind, machten sich die Nachteile des Pentium 4 am Deutlichsten bemerkbar.
Die erste Generation mit dem Codenamen "Banias" erschien im Jahr 2003 und wurde im 130 nm Prozess produziert. Die Prozessoren takteten mit bis zu 1,7 GHz und hatten eine TDP von lediglich 24,5 Watt. Die zweite Generation, der Dothan, folgte im Mai 2004 und verdoppelte den L2-Cache von 1 auf 2 MByte. Durch die Verkleinerung der Strukturgrößen auf 90 nm konnte die TDP auf 21 Watt gesenkt werden, während der Takt auf 2,1 GHz anstieg. Alternativ zu den Modellen mit FSB400 wurde auch eine Produktreihe mit FSB533 eingeführt, die bis zu 2,26 GHz bei einer TDP von 27 Watt aufwies. Zu dieser Zeit erkannte Intel, daß sich der Pentium M auch für den Desktopeinsatz bestens eignet und stellte die Weichen für diese Nutzung der Pentium M Architektur.
Die aktuelle Modellreihe des Pentium M trägt den Namen "Core" (Single-Core) und "Core Duo" (Dual-Core), sie basiert auf dem Yonah Kern. Der Yonah erhöht den Frontsidebus auf 667 MHz und den CPU-Takt auf 2,33 GHz. Mit einer TDP von 31 Watt sind diese Doppelkern-Prozessoren allerdings auch weiterhin sehr genügsam. Der Yonah erweitert den Funktionsumfang der Pentium M Baureihe um SSE3 und Intels Virtualisierungstechnologie. Obwohl die Bezeichnungen "Core" und "Core Duo" den Anschein erwecken, daß hier bereits die Core Mikroarchitektur zum Einsatz kommt, ist dem nicht so. Intel hatte sich anscheinend etwas zu füh auf den neuen Namen festgelegt.
Sechs Jahre CPU-Entwicklung in der Übersicht
Angesichts der zahlreichen Entwicklungsstufen haben wir Intels Prozessoren vom Pentium III bis zum Core2 Duo mit den wichtigsten Eckdaten in Form eine Tabelle zusammengefaßt:
| Name | Kerne | GHz | FSB | L2 | nm | Transistoren in Mio. |
Erweiterungen |
| Pentium III | |||||||
| Coppermine | 1 | 1,13 | 100, 133 | 256 | 180 | 28,1 | MMX, SSE |
| Tualatin | 1 | 1,40 | 133 | 512 | 130 | 44 | MMX, SSE |
| Pentium 4 / Netburst | |||||||
| Willamette | 1 | 2,00 | 400 | 256 | 180 | 42 | MMX, SSE, SSE2 |
| Northwood | 1 | 3,40 | 400, 533, 800 | 512 | 130 | 55 | MMX, SSE, SSE2, HT |
| Prescott | 1 | 3,80 | 533, 800 | 1024 | 90 | 125 | MMX, SSE, SSE2, SSE3, EM64T, XD-Bit, HT |
| Prescott 2M | 1 | 3,80 | 800 | 2048 | 90 | 169 | MMX, SSE, SSE2, SSE3, EM64T, EIST, XD-Bit, HT, VT |
| Cedar Mill | 1 | 3,80 | 800 | 2048 | 65 | 188 | MMX, SSE, SSE2, SSE3, EM64T, EIST, XD-Bit, HT |
| Pentium D / Netburst | |||||||
| Smithfield | 2 | 3,20 | 533, 800 | 2x1024 | 90 | 230 | MMX, SSE, SSE2, SSE3, EM64T, EIST, XD-Bit |
| Presler | 2 | 3,60 | 800 | 2x2048 | 65 | 376 | MMX, SSE, SSE2, SSE3, EM64T, EIST, XD-Bit |
| Pentium (4) Extreme Edition / Netburst | |||||||
| Gallatin | 1 | 3,20 / 3,46 GHz | 800, 1066 | 512+2048 | 130 | 178 | MMX, SSE, SSE2, HT |
| Prescott 2M EE | 1 | 3,73 | 1066 | 2048 | 90 | 169 | MMX, SSE, SSE2, SSE3, EM64T, XD-Bit, HT |
| Smithfield EE | 2 | 3,20 | 800 | 2x1024 | 90 | 230 | MMX, SSE, SSE2, SSE3, EM64T, XD-Bit, HT |
| Presler EE | 2 | 3,46 / 3,73 GHz | 1066 | 2x2048 | 65 | 376 | MMX, SSE, SSE2, SSE3, EM64T, XD-Bit, HT, VT |
| Pentium M | |||||||
| Banias | 1 | 1,70 | 400 | 1024 | 130 | 77 | MMX, SSE, SSE2, EIST |
| Dothan | 1 | 2,26 | 400, 533 | 2048 | 90 | 140 | MMX, SSE, SSE2, EIST, XD-Bit |
| Yonah/Core Solo | 1 | 1,66 | 667 | 2048 | 65 | 151 | MMX, SSE, SSE2, SSE3, EIST, XD-Bit |
| Yonah/Core Duo | 2 | 2,33 | 533, 667 | 1x2048 | 65 | 151 | MMX, SSE, SSE2, SSE3, EIST, XD-Bit, VT |
| Core Mikroarchitektur | |||||||
| Allendale | 2 | 2,13 | 1066 | 1x2048 | 65 | 167 | MMX, SSE, SSE2, SSE3, SSE4, EM64T, EIST, XD-Bit, VT |
| Conroe | 2 | 2,93 | 1066 | 1x4096 | 65 | 291 | MMX, SSE, SSE2, SSE3, SSE4, EM64T, EIST, XD-Bit, VT |
Betrachtet man die Anzahl der Transistoren, so zeigt sich die enge Verwandschaft zwischen dem mobilen Yonah (Core Duo) und dem Allendale (Core2 Duo). Allendale und Conroe sind bemerkenswerter Weise die ersten Pentium M Abkömmlinge mit 64-Bit Unterstützung.
Intel Core2 Duo und Core2 Extreme - 3/18
24.07.2006 by doelf
Zur HTML-Ansicht
Namen und Nummern
Kommen wir nun zur Core Mikroarchitektur, die als Weiterentwicklung der P6 (Pentium III) und Pentium M Baureihe verstanden werden darf. Mit dem aktuellen Architekturwechsel kehrt Intel dem GHz-Wahn nun endgültig den Rücken zu. Nachdem sich die Netburst Prozessoren auf dem Sockel 478 zunächst über ihre Taktrate definierten, konnte diese "Qualität" nicht auf die mobilen Pentium M Prozessoren übertragen werden, da diese mit deutlich geringerem Takt eine vergleichbar gute Leistung erzielten. Diese Prozessoren bekamen, wie auch die Netburst Prozessoren für den Sockel LGA775, statt der Taktrate eine Modellnummer zugeteilt. Intels erklärte Absicht war es, dem Kunden anhand der Modellnummern zu verdeutlichen, welcher Leistungsgruppe die unterschiedlichen Prozessoren zuzuordnen sind. Dieses Vorhaben ist gescheitert, denn wenn man als Kunde derzeit die ausufernden Preislisten der Händler durchblättert, fühlt man sich eher verwirrt als informiert. Für den Sockel LGA775 gibt alleine 30 Pentium 4 Prozessoren mit Taktraten zwischen 2,66 bis 3,8 GHz, dazu kommen 9 Pentium D Modelle und 23 Celeron Prozessoren.

Kein Durchblick: ausufernde Modelllisten bei Intel
Dröseln wir die Produktnummern doch mal schnell auf:
Die Single-Core Netburst Prozessoren belegen bei Intel die Modellreihen 300 (Celeron), 500 (Prescott) und 600 (Prescott 2M und Cedar Mill). Die Modellreihen 800 (Smithfield) und 900 (Presler) sind den Dual-Core Netburst CPUs vorbehalten. Der mobile Celeron M belegt die Modellreihe 400, einige CPUs dieser Baureihe tragen aber verwirrenderweise auch eine 300er Kennung. Intel Prozessoren mit einer 700 im Namen stammen aus der Pentium M Serie. So weit, so gut.
Mit der Einführung der Mobil CPUs mit Yonah Kern brach Intel mit diesem System und teilte den einkernigen Core Solo Prozessoren die Kennung T1000 zu, während die doppelkernigen Core Duos als T2000 bezeichnet werden. Nochmals zur Erinnerung: Weder Core Solo noch Core Duo basieren auf der Core Mikroarchitektur, erst der Merom Kern, der in Kürze erwartet wird, bringt die Core Mikroarchitektur auch auf Intels mobile Plattform.
Die Core2 Duo und Core2 Extreme Prozessoren, die wir heute vorstellen wollen, bekommen nun die Modellreihen E6000 und X6000 zugesprochen, wobei sich der Core2 Extreme X6800 von seinen Artgenossen lediglich durch einen höheren Takt und eine um 10 Watt höhere TDP unterscheidet. Ach ja, eine Kleinigkeit wäre da noch: Intel hat beim Core2 Extreme die Multiplikatoren freigeschaltet!
Die Core Mikroarchitektur
Intel bringt die Core2 Duo Prozessoren in zwei Geschmacksrichtungen auf den Markt: Als Allendale mit 2 MByte L2-Cache sowie als Conroe mit 4 MByte L2-Cache. Bei beiden Varianten handelt es sich um Doppelkern Prozessoren, bei denen beide Kerne auf einen gemeinsamen Cache zugreifen. Dieses Prinzip eines "Shared Cache" hatte Intel beim Yonah (Core Duo) eingeführt, der - wie der Allendale - 2 MByte L2-Cache bietet. Vergleicht man Yonah und Allendale miteinander, so zeigt sich bereits anhand der Transistorenzahl die nahe Verwandschaft. Der Yonah bringt es auf 151 Millionen Transistoren, der Allendale hat mit 167 Millionen zwar noch ein paar mehr, erweitert die Funktionen des Yonah aber auch um EM64T sowie SSE4. Aufgrund des doppelt so großen L2-Caches bringt es der Conroe auf 291 Millionen Transistoren.
Äußerlich unterscheiden sich Core2 Extreme X6800 (links) und Pentium 4 Extreme Edition 965 (rechts) jedoch kaum:
Core2 Modelle mit nur einem Kern (Conroe-L) werden erst im zweiten Quartal 2007 erwartet und sollen dann den Celeron im Einstiegsmarkt ablösen. Bis dahin wird Intel für den preiswerten Einstiegssektor auch weiterhin auf die Netburst Architektur setzen und Ende August mit dem Celeron D 360 (3,46 GHz, FSB533, 512 KByte L2-Cache) die wahrscheinlich letzte Netburst CPU auf den Markt bringen.
Betrachtet man die Funktionsliste von Allendale und Conroe, so bietet die Core Mikroarchitektur mit den Multimedia-Erweiterungen MMX, SSE, SSE2, SSE3 und SSE4, dem 64-Bit Befehlssatz EM64T (Intel Extended Memory 64 Technology), dem XD-Bit (Execute Disable Bit), welches vor Angriffen durch Pufferüberlauf schützt, der Stromsparfunktion EIST (Erweiterte Intel SpeedStep Technologie) und Intels Virtualisierungs Technologie (VT) all das, was man auch von der Netburst Architektur her kennt. Neu hinzugekommen ist lediglich die vierte Generation des SSE Befehlssatzes, ausgedient hat hingegen die HyperThreading Technologie. Letzteres war abzusehen, da physikalische Kerne den logischen eindeutig überlegen sind und die Kombination der beiden Techniken bereits bei den Pentium Extreme Edition Modellen mit Smithfield und Presler Kern kaum Vorteile zeigte.
Doch auch ein wesentlicher Architekturunterschied führt dazu, daß die Core Mikroarchitektur nicht von der HyperThreading Technologie profitieren kann: Wie in unserem geschichtlichen Rückblick beschrieben, wurde HyperThreading in erster Linie dazu eingeführt, um die Netburst Architektur mit ihrer langen Pipeline effektiver auslasten zu können. Doch während ein Pentium 4 mit Prescott Kern eine 31-stufige Pipeline verwendet, hat die Pipeline des Conroe, des Allendale und auch die des Yonah lediglich 14 Stufen.
Intel Core2 Duo und Core2 Extreme - 4/18
24.07.2006 by doelf
Zur HTML-Ansicht
Intel hat die wichtigsten Neuerungen der Core Mikroarchitektur mit fünf Schlagworten versehen, welche wir auf dieser und der folgenden Seite näher beleuchten wollen:
Wide Dynamic Execution
Unter dem Namen "Dynamic Execution" faßte Intel beim Pentium III verschiedene Techniken zusammen, die zum Teil schon mit dem Pentium Pro eingeführt worden waren. Diese Techniken wurden für die Netburst Architektur in Form der "Advanced Dynamic Execution" auf die lange Pipeline optimiert. Wir wollen an dieser Stelle vier Begriffe erklären, die eine moderne Prozessorarchitektur prägen:
Während alle Intel Prozessoren vom Pentium Pro über den Pentium 4 und D bis zum Pentium M (und auch AMDs Athlon und Athlon 64) ein dreifach superskalares Design verwenden, arbeiten die CPUs der Core Mikroarchitektur mit einem vierfach superskalarem Design. Doch Intel begnügt sich nicht mit einer vierfach superskalaren Architektur, sondern kann sogar bis zu fünf Befehle pro Taktzyklus bearbeiten. Denn während bisherige Architekturen jeden Befehl einzeln decoden und danach ausführen, beherrschen die Prozessoren der Core Mikroarchitektur eine Funktion namens "Macrofusion". Typische x86-Befehlsfolgen (Macro-Ops) können mit Macrofusion zu einer einzelnen internen Instruktion (Micro-Op) zusammengefaßt werden.
Während der x86-Programmcode aus komplexen Instruktionen (CISC = Complex Instruction Set Computing) - also den Macro-Ops - besteht, werden diese zur internen Verarbeitung in einfache Strukturen aufgebrochen. Dabei handelt es sich um die RISC-ähnlichen (Reduced Instruction Set Computing) Micro-Ops. Diese Micro-Ops gehen dann zur weiteren Verarbeitung in die Pipeline des Prozessors. An dieser Stelle greift nun die "Mikro-Op Fusion", die aus der selben Macro-Op stammende Micro-Ops zusammenfassen kann und somit zu einer weiteren Effizienzsteigerung beiträgt.
Da Conroe und Allendale zwei Prozessorkerne besitzen, verdoppeln sich auch alle zuvor getroffenen Aussagen. Jeder Kern kann vier Befehle pro Taktzylkus ausführen, das ergibt zusammen acht. Eine CPU mit vier Kernen käme demnach auf sechszehn Befehle pro Taktzyklus - und diese Quad-Cores werden uns Ende 2006 sicherlich noch näher beschäftigen!
Intelligent Power Capability
Das Erbe des Pentium M ist natürlich insbesondere in Hinblick auf die Stromsparfunktionen offensichtlich. Die Prozessoren der Core Mikroarchitektur sind in der Lage, nicht benötigte Logik-Baugruppen abzuschalten, um Energie zu sparen. Hierzu gehören beispielsweise Teile des Caches. Auch die Busse und Arrays wurden unterteilt ("split"), um diese teilweise abschalten zu können, wenn sie nicht vollständig benötigt werden. Ein Problem bei solchen Stromsparfunktionen sind die Einschlaf- und Aufwachphasen, die sich nicht negativ auf die Reaktionsgeschwindigkeit der CPU auswirken dürfen. Intel bewerkstelligt das Ein- und Ausschalten innerhalb eines Taktzyklus, weshalb es kaum zu Auswirkungen auf die CPU-Leistung kommen sollte.
Zudem verfügen auch Allendale und Conroe über Intels SpeedStep Technologie, welche die Kerne abhängig vom Lastzustand taktet oder gar in verschiedene Ruhezustände versetzt. Mit der Taktrate wird natürlich auch die CPU-Spannung abgesenkt. Eine Reihe von Temperatursensoren wurde von Intel an den Hotspots der Kernes verteilt. Diese achten darauf, daß sich die CPU nicht zu stark aufheizt und reduzieren im Falle einer Überhitzung ebenfalls den Prozessortakt.
| CPU | TDP | EHP | max TC |
| Core Mikroarchitektur | |||
| Core2 Extreme X6800 2,93 GHz / FSB1066 / 4MB L2 |
75W | 22W | 60,4°C |
| Core2 Duo E6700 2,67 GHz / FSB1066 / 4MB L2 |
65W | 22W | 60,1°C |
| Core2 Duo E6600 2,4 GHz / FSB1066 / 4MB L2 |
65W | 22W | 60,1°C |
| Core2 Duo E6400 2,13 GHz / FSB1066 / 2MB L2 |
65W | 22W | 61,4°C |
| Core2 Duo E6300 1,86 GHz / FSB1066 / 2MB L2 |
65W | 22W | 61,4°C |
| Netburst Architektur | |||
| Pentium EE965 3,73 GHz / FSB1066 / 2MB L2 |
130W | - | 68,6°C |
Im Vergleich zum bisherigen Spitzenmodell Pentium Extreme Edition 965 konnte Intel die TDP (Thermal Design Power) beinahe halbieren, zudem können die Core2 Duo Prozessoren in einen Extended HALT State gehen, der die Leistungsaufnahme auf 22 Watt absenkt. Dafür dürfen die neuen Kerne nicht ganz so warm werden: Bei maximaler TDP sinkt die zulässige Höchsttemperatur um 7 bis 8°C. Das könnte sich auf die Lautstärke der CPU-Kühler auswirken.
Intel Core2 Duo und Core2 Extreme - 5/18
24.07.2006 by doelf
Zur HTML-Ansicht
Smart Memory Access
Ein Punkt, bei dem AMD bisher glänzen konnte, ist der Speicherzugriff. Dank des in der CPU integrierten Speichercontrollers sparten sich die Texaner den Umweg über den Chipsatz und konnten die maximal möglichen Speicherbandweiten gut ausnutzen. Intel möchte diesen Vorteil des Mibewerbers durch optimierte Lese- und Schreibzugriffe (Load/Store) ausgleichen.
Eine Limitierung der Out Of Order Execution ist, daß die Befehle zwar in einer optimierten Reihenfolge ausgeführt werden, die CPU aber nur bedingt erkennen kann, welche Befehle zusammenhängen und welche nicht. Wenn die Zieladresse eines Lese- oder Schreibzugriffes noch nicht bekannt ist, kann keine Optimierung der Befehle vorgenommen werden, da die Gefahr besteht, daß Daten gelesen werden bevor sie geschrieben wurden. Um unnötige Wartezyklen vermeiden zu können, wäre es allerdings erstrebenswert, die Lesezugriffe vorzuziehen. Doch wie soll der Prozessor erkennen, welche Zugriffe voneinander abhängig sind und welche nicht?
Intel nennt die Lösung "Memory Disambiguation". Diese Technologie wägt anhand intelligenter Algorithmen ab, ob die Lesezugriffe von den Schreibzugriffen abhängig sind oder nicht. Danach werden die Zugriffe mit der höchst möglichen Parallelisierung ausgeführt. Sollte sich zeigen, daß der Prozessor falsch spekuliert hat, werden die fehlerhaften Daten neu geladen und die Datenkohärenz bleibt erhalten.
Folgendes Beispiel zeigt, wie der Lesevorgang 4 vorgezogen und zuerst ausgeführt wird:
Zudem besitzen die Prozessoren der Core Mikroarchitektur "Advanced Prefetcher", welche Daten in den Cache laden, bevor diese benötigt werden. Dadurch läd die CPU die Daten vermehrt aus dem Cache, statt sie aus dem Speicher holen zu müssen. Da zumindest der Conroe über 4 MByte L2-Cache verfügt, kann diese Technik die wahren Latenzen der Speicherzugriffe verwischen oder - wie Intel es formuliert - verstecken. Intel verwendet zwei Daten-Prefetcher pro L1-Cache sowie zwei weitere für den L2-Cache, hinzu kommen zwei Befehls-Prefetcher, also einer je Kern.
Advanced Smart Cache
Im Gegensatz zu den Pentium D Prozessoren mit Smithfield oder Presler Kern und AMDs Athlon 64 X2 teilen sich die beiden Kerne des Allendale und Conroe einen gemeinsamen L2-Cache. Dies hat entscheidende Vorteile: Zum einen kann sich jeder Kern soviel L2-Cache sichern, wie er gerade benötigt, zum anderen hat jeder Prozessorkern Zugriff auf alle im L2-Cache befindlichen Daten. Hierzu zwei Beispiele:
Das zweite Beispiel zeigt allerdings noch ein weiteres Problem getrennter Caches auf: Es ist nicht unwahrscheinlich, daß am Ende identische Daten in beiden L2-Caches zu finden sind und somit doppelt soviel Platz verbrauchen. Auch wenn diese drei Punkte für Prozessoren mit lediglich zwei CPU-Kernen noch nicht so kritisch erscheinen, wachsen die Nachteile mit jedem weiteren Kern an. In Hinblick auf die kommenden Quad-Core Prozessoren ist der Advanced Smart Cache auf jeden Fall eine gute Investition in die Zukunft - auch wenn der für den Jahreswechsel geplante Kentsfield zwei Conroe-Kerne verwenden und somit über zwei L2-Caches verfügen wird.
Im Gegensatz zum L2-Cache verfügen die beiden CPU-Kerne auch weiterhin über einen eigenen L1-Cache. Dieser setzt sich jeweils aus einem 32 KByte großen Ausführungs-Cache und einen ebenfalls 32 Bit großen Daten-Cache zusammen. Intels erster Dual-Core Kern mit gemeinsamen L2-Cache war, wie gesagt, der Yonah (Core Duo).
Advanced Digital Media Boost
Mit dem "Advanced Digital Media Boost" will Intel seiner Befehlssatzerweiterung SSE (Streaming Single Instruction Multiple Data Extensions) Beine machen. Die vierte SSE-Generation, welche Intel mit der Core Mikroarchitektur einführt, erweitert den Befehlssatz um 16 neue Instruktionen. Eigentlich hatte jeder erwartet, daß Intel die neue Ausbaustufe des Befehlssatzes auf den Namen SSE4 taufen würde, doch bisher blieb diese Erweiterung namenlos. Wir verwenden in diesem Artikel dennoch die Bezeichnung SSE4, um dieses Unterscheidungsmerkmal kennzuzeichnen.
Doch nicht die neuen Instruktionen, sondern die 128 Bit breiten SSE-Einheiten machen den Unterschied. Sowohl die Netburst Prozessoren als auch die bisherigen Pentium M Modelle mußten eine 128 Bit Berechnung in zwei Schritten ausführen. Zunächst wurden die unteren 64 Bit, im Anschluß dann die oberen 64 Bit berechnet, das Ergebnis lag daher erst nach zwei Taktzyklen vor. Die Core Mikroarchitektur bietet einen 128 Bit breiten Datenpfad und kann solche Operationen nun in einem Schritt bearbeiten, also quasi in der halben Zeit.
Intel Core2 Duo und Core2 Extreme - 6/18
24.07.2006 by doelf
Zur HTML-Ansicht
Die Preise
Preislich beerbt der X6800 als neues Spitzenmodell den Intel Pentium 4 Extreme Edition 965, der E6700 übernimmt den Preis des Pentium D 960, der E6600 den des Pentium D 950, der E6400 den des Pentium D 940 und der E6300 ist nur wenig teurer als der Pentium D 930 es bisher war. Die Prozessoren mit Netburst Architektur rutschen entsprechend je eine Preisstufe nach unten, zudem werden mit dem Pentium D 945 und D 915 zwei neue Modelle ohne Intels Virtualisierungstechnologie eingeführt.
Hier nun die neuen Preise in der Übersicht (in US-Dollar bei einer Abnahme von 1.000 Stück):
| CPU | aktueller Preis |
ab 23.7. |
| Core Mikroarchitektur | ||
| Core2 Extreme X6800 2,93 GHz / FSB1066 / 4MB L2 |
- | 999 |
| Core2 Duo E6700 2,67 GHz / FSB1066 / 4MB L2 |
- | 530 |
| Core2 Duo E6600 2,4 GHz / FSB1066 / 4MB L2 |
- | 316 |
| Core2 Duo E6400 2,13 GHz / FSB1066 / 2MB L2 |
- | 224 |
| Core2 Duo E6300 1,86 GHz / FSB1066 / 2MB L2 |
- | 183 |
| Netburst Architektur | ||
| Pentium D 960 3,6 GHz / FSB800 / 2x2MB L2 |
530 | 316 |
| Pentium D 950 3,4 GHz / FSB800 / 2x2MB L2 |
316 | 224 |
| Pentium D 945 3,4 GHz / FSB800 / 2x2MB L2 |
- | 163 |
| Pentium D 915 2,8 GHz / FSB800 / 2x2MB L2 |
- | 133 |
| Pentium D 820 2,8 GHz / FSB800 / 2x1MB L2 |
178 | 113 |
| Pentium D 805 2,66 GHz / FSB533 / 2x1MB L2 |
k.A. | 93 |
Der Einstieg in die Core Mikroarchitektur kostet 183 US-Dollar, dafür bekommt man allerdings auch eine leistungsstarke Dual-Core CPU - das Angebot klingt also durchaus fair. Wer mit einem höheren Stromverbrauch und weniger Performance leben kann, bekommt mit dem Pentium D 805 nun schon für 93 US-Dollar eine CPU mit zwei Prozessorkernen. Aufgrund des mit 533 MHz getakteten Frontsidebusses ist dieser Prozessor auch für Übertakter sehr interessant, wie unser Testbericht vor einigen Wochen zeigte.
Vergleicht man Intels Preise mit denen, die AMD ab heute für seine eigenen CPUs festgesetzt hat, fällt auf, daß der Core2 Extreme X6800 keinen direkten Gegenspieler aus Texas bekommen wird: Der AMD Athlon64 FX62 ist ganze 172 US-Dollar preiswerter. Auch der E6700 und E6600 bleiben ohne Gegenspieler, da der Athlon64 X2 5000+ auf 301 US-Dollar abrutscht und sich somit zwischen E6600 und E6400 einordnet. Die Texaner scheinen die vorläufige Überlegenheit der Core Mikroarchitektur akzeptiert zu haben und nun auf geringe Anschaffungskosten zu setzen.
Fassen wir also auch die neuen, bestätigten Preise für AMD Prozessoren zusammen (in US-Dollar bei einer Abnahme von 1.000 Stück):
| CPU | aktueller Preis |
ab 24.7. |
| AMD AM2, Dual Core | ||
| Athlon64 FX62 | 999 | 827 |
| Athlon64 X2 5000+ | 649 | 301 |
| Athlon64 X2 4600+ | 522 | 240 |
| Athlon64 X2 4200+ | 339 | 187 |
| Athlon64 X2 3800+ | 277 | 152 |
Auch wenn diese Preissenkungen auf den ersten Blick gewaltig aussehen, werden AMDs Prozessoren damit nicht zu echten Schnäppchen. Lediglich die Relation von Preis und Leistung wird dem Core2 Duo angepaßt, wie die Benchmarks später noch zeigen werden.
Intel Core2 Duo und Core2 Extreme - 7/18
24.07.2006 by doelf
Zur HTML-Ansicht
Chipsätze
Für Intel Benutzer ist es zu einem echten Problem geworden, daß Intel seine Prozessoren und Chipsätze zu Plattformen zusammenfaßt. Wer eine neue CPU erwirbt, kann diese normalerweise nicht auf einem Mainboard verwenden, welches einen älteren Chipsatz nutzt. Das bedeutet natürlich auch für alle Core2 Duo Interessenten, daß neben dem Erwerb der neuen CPU im Normalfall auch ein neues Mainboard erforderlich ist.
Intel hat bisher nur den 975X Chipsatz für die Core2 Duo Prozessoren freigegeben, zeitgleich mit der Markteinführung der CPUs sollen jedoch auch die ersten Broadwater Chipsätze vorgestellt werden. Bisher sind wir davon ausgegangen, daß es sich zunächst nur um die Varianten G965 und Q965 mit integrierter Grafikeinheit handeln würde, doch auch Mainboards mit dem P965 werden schon heute von vielen Händlern angeboten. Die Broadwater Chipsätze verwenden Intels neue ICH8 Southbridge, die sechs Serial-ATA II Ports sowie zehn USB 2.0 Anschlüsse bietet. Auf ATA100 oder ATA133 verzichtet Intel in Zukunft, neue DVD-Brenner und -Laufwerke sollten sich also via Serial-ATA anschließen lassen.
Intels 945 Chipsatz wurde zwar nicht für den Conroe und Allendale freigegeben, doch zumindest Asrock bietet ein entsprechendes Mainboard an. Generell empfiehlt es sich, vor dem Kauf des Mainboards auf der Webseite des Herstellers zu überprüfen, welche Prozessoren im Einzelfall unterstützt werden. Sebst die Besitzer eines Mainboards mit 975X Chipsatz sollten sich nicht allzu sicher fühlen, denn hier hängt es von der Revision ab, ob die Core Mikroarchitektur unterstützt wird oder nicht. Für diesen Test verwendeten wir Intels D975XBX, welches ab der Revision 304 mit dem Core2 Duo zurecht kommt.
Während SiS und VIA noch keine Angaben zur Kompatibilität ihrer Chipsätze mit der Core Mikroarchitektur machen, hat NVIDIA den nForce 590 SLI sowie den nForce 570 SLI freigegeben.
Testumgebung
Für den Leistungsvergleich verwenden wir Intels neues Spitzenmodell Core2 Extreme mit 2,93 GHz Taktrate sowie das bisherige Spitzenmodell Pentium Extreme Edition 965 mit 3,73 GHz. Beide Prozessoren verfügen über zwei Kerne, der Pentium Extreme Edition 965 beherrscht zusätzlich noch die HyperThreading Technologie und bietet somit zwei logische Prozessoren pro Kern. Die Ergebnisse des Core2 Duo E6700 und E6600 haben wir mit dem X6800 simuliert, dessen Multiplikator sich frei einstellen läßt. Diese Prozessoren sind abgesehen von der TDP baugleich.
Da die Mehrzahl unserer Leser sicherlich eine etwas bescheidenere CPU verwenden wird, haben wir zudem einen Pentium 4 560 mit 3,6 GHz Taktrate in den Vergleich aufgenommen. Dieser Prozessor verfügt nur über einen Kern, beherrscht aber die HyperThreading Technologie.
Für die Benchmarks der AMD Plattform verwendeten wir das MSI K9N SLI Platinum (BIOS 1.1) mit NVIDIAs nForce 570 SLI Chipsatz. In Hinblick auf die CPU sind wir derzeit etwas mager bestückt und haben nur einen Athlon 64 X2 4000+ mit 2,0 GHz Taktrate und 1 MByte L2-Cache pro Kern zur Verfügung. Wir haben diesen Prozessor auf 2,4 GHz (HT 960 MHz, DDR2-800) übertaktet, so daß er in etwa das Leistungsniveau des Athlon 64 X2 4800+ repräsentiert. Zudem geben wir die Messungen bei 2,0 GHz Taktrate an.
Intel Core2 Duo und Core2 Extreme - 8/18
24.07.2006 by doelf
Zur HTML-Ansicht
CPU-Leistung (synthetisch)
Traditionell prüfen wir zunächst die mathematischen Leistungen der Prozessoren mit synthetischen Benchmarks. Hierzu verwenden wir SiSoft Sandra 2007 Pro Business (Build 1098):
| SiSoft Sandra 2007.1098: Dhrystone ALU in MIPS; Whetstone iSSE3 in MFLOPS | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 26733 18500 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 24375 16812 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 21843 14997 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 17815 21871 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 17429 14716 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 14580 12306 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 8413 10524 | |
Sandra nutzt für diesem Test alle Kerne, so daß der Single-Core Pentium 4 560 in diesem Vergleich trotzt 3,60 GHz Taktrate untergeht. Während die Core Mikroarchitektur schier unglaublich hohe Werte bei Integer-Operationen erzielt, kann sich der Pentium 4 Extreme Edition 965 zumindest bei der Gleitkomma-Berechnung behaupten.
Ein zweiter Testlauf mit SiSoft Sandra 2007 Pro Business (Build 1098) soll die Multimedia-Performance offenbaren:
| SiSoft Sandra 2007.1098: Integer X8 iSSE4 in it/s; FloatingPoint X4 iSSE2 in it/s | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 160022 86146 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 145303 78222 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 130569 70291 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 53312 68665 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 45199 49215 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 37814 41171 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 25312 32690 | |
Auch bei Multimedia-Berechnungen profitiert der Conroe von seiner bärenstarkten Integer-Einheit. Das bedeutet nicht, daß eine der anderen CPUs bei der Gleitkomma-Berechnung Land sehen würde, hier ist der Vorsprung lediglich nicht ganz so überwältigend. Um es ganz klar zu sagen: In den letzten sechs Jahren haben wir solche Leistungssprünge nicht einmal annähernd gesehen!
Ein zweites Gutachten über die CPU-Leistung holen wir von PC Wizard 2006.1.69 ein:
| PC Wizard 2006.1.69: Dhrystone (ALU) in MIPS; Whetstone (FPU) in MFLOPS; Whetstone (SSE2) in MFLOPS | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 32574 10196 13093 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 29792 9217 11936 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 26756 8287 10770 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 20301 7457 9651 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 20205 8303 14156 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 15690 6261 8056 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 11390 3979 6773 | |
PC Wizard bestätigt die Messungen mit SiSoft Sandra 2007: Die Integer-Leistung ist gewaltig, bei der Gleitkomma-Berechnung kann lediglich der Pentium 4 Extreme Edition 965 mithalten.
Intel Core2 Duo und Core2 Extreme - 9/18
24.07.2006 by doelf
Zur HTML-Ansicht
Multithreaded (synthetisch)
Zudem kann PC Wizard 2006.1.69 die Performance im Multi-Threaded-Betrieb analysieren. Dabei wird zunächst nur ein Thread ausgeführt, danach zwei Threads parallel und schließlich vier Threads. Ausgegeben wird die Bearbeitungszeit pro Thread, niedrige Ergebnisse sind also besser:
| PC Wizard 2006.1.69: 4 Threads in s; 2 Threads in s; 1 Thread in s | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 3,590 3,610 7,270 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 3,964 3,967 7,996 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 4,410 4,440 8,740 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 6,210 7,720 13,380 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 8,859 8,875 15,171 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 9,281 9,219 16,750 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 13,350 13,390 14,440 | |
Sowohl bei der rohen Rechenleistung mit einem Thread als auch im Multi-Threaded-Betrieb dominiert der Conroe die Benchmarks überdeutlich. Die einzige CPU, die aus vier Threads einen klaren Vorteil erzielen kann, ist der Pentium 4 Extreme Edition 965, da er nicht nur zwei Kerne sondern auch HyperThreading bietet. Die Vorteile von HyperThreading fallen jedoch nicht gerade gewaltig aus, wie der Pentium 4 560 beweist.
Auch CPU RightMark Lite 2005 v1.3 bietet die Möglichkeit, eine Anwendung in mehrere Threads aufzuteilen und somit mehrere CPU-Kerne auszulasten. Dafür berechnet das Programm ein komplexes 3D-Gefüge mit 400 Objekten und 4 Lichtern, wir wählten das Modell 1. Die Ergebnisse werden in Frames pro Sekunde angegeben, größere Werte sind also besser. Wir sortieren nach der maximal erreichbaren Framerate:
| CPU RightMark Lite 2005 v1.3: 4 Threads in fps; 2 Thread in fps; 1 Thread in fps | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 16,6 16,6 10,3 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 15,2 15,2 9,2 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 15,1 9,7 7,2 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 13,8 13,8 8,4 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 13,0 13,0 8,0 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 11,0 11,0 6,7 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 9,0 9,1 6,9 | |
CPU RightMark sieht den Conroe ebenfalls klar vorne, lediglich bei vier Threads kann der Pentium 4 Extreme Edition 965 den Core2 Duo E6600 hinter sich lassen. Die Leistung des Pentium 4 Extreme Edition 965 mit nur zwei Threads erwies sich als unstet: Zumeist sahen wir zwischen 9 und 10 fps, ab und zu erzielte diese CPU jedoch auch bis zu 12 fps. Hier scheint die Verlastung der Threads auf die beiden Kerne nicht sauber zu funktionieren.
Bevor wir uns dem Speicherdurchsatz zuwenden, betrachten wir noch einen letzten CPU-Test, welcher alle CPU-Kerne auslastet. Die Molecular Dynamics Simulation von ScienceMark 2.0 untersucht das thermodynamische Verhalten von Materialien anhand fester physikalischer Gesetze. Je schneller die Berechnung beendet ist, desto performanter ist die CPU. Die Resultate werden in Sekunden angegeben, niederigere Werte sind folglich besser:
| ScienceMark 2.0 32-Bit Build 21032005: Molecular Dynamics in s | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 53,88402 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 59,30935 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 61,86913 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 66,00453 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 70,05000 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 74,76085 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 93,90075 | |
Die Netburst Prozessoren haben keine Chance, der Core Extreme X6800 ist 30 Prozent schneller als der Pentium Extreme Edition 965. Lediglich der Athlon 64 X2 kann sich gegen den gleich schnell getakteten Core2 Duo E6600 durchsetzen. In Hinblick auf die synthetische Rechenleistung konnte die Core Mikroarchitektur schon einmal voll und ganz überzeugen. Doch wie sieht es beim Speicherdurchsatz aus?
Intel Core2 Duo und Core2 Extreme - 10/18
24.07.2006 by doelf
Zur HTML-Ansicht
Datendurchsatz von Speicher und Cache
Zum Ausloten der Speicherbandbreite ziehen wir zunächst wieder SiSoft Sandra 2007 Pro Business (Build 1098) heran:
| SiSoft Sandra 2007.1098: Int Buff'd iSSE2 in MB/s; Float Buff'd iSSE2 in MB/s | ||
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 7754 7653 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 7576 7552 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 6426 6413 | |
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 5555 5556 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 5518 5536 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 5459 5459 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 4847 4849 | |
Der Speicherdurchsatz des Conroe kann nicht mit dem Athlon 64 X2 mithalten und verfehlt auch die Leistung des Pentium Extreme Edition 965 deutlich. Hier scheint sich die komplexe Architektur aus Dual-Core und HyperThreading auszuzahlen, denn die hohe Taktrate der Netburst Prozessoren alleine reicht nicht aus, wie der Pentium 4 560 beweist. Die AMD Prozessoren profitieren hingegen ganz klar vom integrierten Speichercontroller.
Mit ScienceMark 2.0 versuchen wir festzustellen, wie schnell die Zugriffe auf den L1- und L2-Cache erfolgen, zudem messen wir ein zweites Mal den Speicherdurchsatz:
| ScienceMark 2.0 32-Bit Build 21032005: L1 Cache in MB/s; L2 Cache in MB/s; Memory in MB/s | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 80760,52 24601,40 5101,78 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 71457,80 22341,78 5087,53 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 66469,14 20076,08 5052,49 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 27671,19 8732,30 5953,07 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 23176,86 7313,55 5829,66 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 19797,13 3500,61 5684,04 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | - - 4500,42 | |
Während der Conroe die mit Abstand schnellsten Cachezugriffe bietet, erzielen der Athlon 64 X2 und der Pentium Extreme Edition 965 abermals einen höheren Speicherdurchsatz. Weitere Details sind folgender Grafik zu entnehmen:

Den Speichertest schließen wir mit PC Wizard 2006.1.69 ab. Die folgende Grafik zeigt, wie sich der Speicherdurchsatz in Abhängigkeit der Datenblockgröße entwickelt:

Die Abtreppung zeigt hierbei an, wie lange L1- und L2-Cache verwendet werden und ab wann tatsächlich auf den Arbeitsspeicher zugegriffen wird.
Intel Core2 Duo und Core2 Extreme - 11/18
24.07.2006 by doelf
Zur HTML-Ansicht
Primzahlen und Pi
Die schnelle Fourier-Transformation (FFT) ist ein Algorithmus, welcher zur Berechnung von Primzahlen genutzt wird. Wir verwenden Prime95 v24.14 im Benchmark-Modus, um die Rechenleistung der CPU zu untersuchen. Die Resultate werden in Millisekunden angegeben, kleinere Werte sind also besser:
| Prime95 v24.14 - 10 Iterationen mit 4096K FFT Länge: in ms | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 86,725 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 94,621 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 103,979 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 114,680 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 126,597 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 185,683 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 220,561 | |
Den Primzahlen kommt der Conroe schneller auf die Schliche als jede andere CPU, abermals ist der Vorsprung, insbesondere vor AMDs Athlon 64 X2, beachtlich.
Und was passiert, wenn wir die Nachkommstellen von Pi berechnen?
| Super PI 1.1e, 1M Stellen: Dauer in s | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 17 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 19 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 21 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 34 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 35 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 36 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 43 | |
In diesem Fall braucht der Core 2 Extreme X6800 nur halb soviel Zeit wie der Pentium Extreme Edition 965. Wir sehen hier eine klare Zwei-Klassen-Gesellschaft: Die Core Mikroarchitektur und der Rest.
Intel Core2 Duo und Core2 Extreme - 12/18
24.07.2006 by doelf
Zur HTML-Ansicht
Raytracing und Rendering
Die frei erhältliche Raytracing-Software POV-Ray unterstützt in der aktuellen Beta-Version 3.7 13a mehrere CPU-Kerne. Wir lassen das offizielle Benchmarkscript zweimal laufen: Zunächst als ein Thread, danach multithreaded.
Wir sortieren anhand der höchsten Punktzahl, höhere Werte sind besser:
| Povwin 3.7 beta 13a Benchmark: Multi Thread in PPS; Single Thread in PPS | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 1057,30 536,07 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 957,60 491,16 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 864,90 439,38 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 758,09 332,35 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 682,75 349,02 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 571,53 290,86 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 372,11 320,37 | |
Insbesondere bei der Verwendung nur eines CPU-Kernes liegt der Conroe weit vorne, doch auch im Multi-Threaded-Betrieb dominiert die Core Mikroarchitektur. Lediglich der Pentium 4 Extreme Edition 965 kann halbwegs den Anschluß an den Core2 Duo E6600 wahren, der Core2 Extreme X6800 ist dennoch 39 Prozent schneller.
Mit Cinebench in der aktuellen Version 9.5 kann die Leistung des Computers in Zusammenspiel mit der professionellen 3D-Anwendung Cinema 4D von MAXON bewertet werden.
Wir wählen den Rendering-Test, welcher auf einem oder mehreren CPU-Kernen ausgeführt werden kann. Höhere Werte spiegeln eine höhere Leistung wieder:
| Cinebench Version 9.5 Rendering: X CPUs in CB-CPU; 1 CPU in CB-CPU | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 895 491 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 814 444 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 732 401 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 653 354 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 649 317 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 552 299 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 352 303 | |
Wir sehen beim Core2 X6800 eine Leistungszunahme um das 1,82-fache, sobald der zweite Kern genutzt wird. Der E6700 und E6600 arbeiten ähnlich effizient. AMDs Athlon 64 X2 erzielt die 1,84-fache Performnace, dank zweier Kerne und HyperThreading erzielt der Pentium 4 Extreme Edition 965 die 2,04-fache Leistung. HyperThreading alleine bringt dem Pentium 4 560 lediglich die 1,16-fache Leistung. Doch all diese Angaben ändern nichts daran, daß der Conroe abermals weit vorne liegt und z.B. der Core2 Extreme X6800 den Pentium Extreme Edition 965 um 38 Prozent distanziert.
Intel Core2 Duo und Core2 Extreme - 13/18
24.07.2006 by doelf
Zur HTML-Ansicht
Kompression und mp3-Encoding
7-Zip ist eine kostenlose Kompressionssoftware, die gegenüber vielen Mitbewerbern einen entscheidenden Vorteil hat: Sie ist multi-threaded programmiert und kann mehrere CPU-Kerne nutzen. Ein eingebautes Benchmark-Tool schätzt die Leistung des Prozessors ab:
| 7-Zip 4.42 Benchmark: Single Thread in MIPS; Multi Thread in MIPS | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 2883 4224 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 2570 3889 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 2359 3561 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 2183 3141 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 1868 2680 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 1693 2582 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 1596 1960 | |
Konnte sich bisher der Athlon 64 X2 in diesem Testlauf behaupten, so erobert nun der Conroe die Spitzenplätze. Doch wie sieht es in der Praxis aus? Wir packen das 451 MByte große Multiplayer-Demo von F.E.A.R. als .7z-Datei mit normaler Kompressionsrate. Gemessen wird in Sekunden, geringere Werte sind also besser:
| 7-Zip 4.42 - 451 MByte packen: Single Thread in s; Multi Thread in s | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 204 134 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 216 137 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 230 142 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 251 157 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 283 170 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 297 191 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 307 220 | |
Der Praxistest bestätigt die Benchmark-Theorie: Auch diesmal finden wir die Netburst Prozessoren auf den hinteren Plätzen, schneller ist der Athlon 64 X2, uneinholbar sind jedoch die Conroes. Diesmal liegt der Core2 Extreme X6800 ca. 31 Prozent vor dem Pentium Extreme Edition 965.
Als nächstes testen wir die Leistung beim mp3-Encoding. Wir verwenden hierfür Lame 3.98a6 in Verbindung mit PC Wizard 2006.1.69 und komprimieren eine 60 MByte große WAV-Datei. Gemessen wird in Sekunden, niedrige Werte sind somit besser:
| PC Wizard 2006.1.69: Normale Qualität in s | ||
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 11,34 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 13,59 | |
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 14,13 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 15,53 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 17,30 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 23,03 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 24,25 | |
Siehe da, der Conroe gewinnt doch nicht jeden Testlauf! Beim mp3-Encoder Lame setzt sich AMDs Athlon 64 X2 an die Spitze. Dafür schlägt der Conroe die Netburst Prozessoren wieder einmal deutlich.
Intel Core2 Duo und Core2 Extreme - 14/18
24.07.2006 by doelf
Zur HTML-Ansicht
Video-Encoding
Betrachten wir nun zwei Video-Encoding-Benchmarks. Zunächst werden wir eine 455 MByte große AVI-Datei (huffyuv lossless Codec) mit TMPGEnc 2.512.52.161 ins DVD-Format (PAL) umwandeln. Wir verwenden hierbei die höchste Qualitätsstufe.
Das Ergebnis wird in Sekunden gemessen, kleinere Werte spiegeln die höhere Leistung wieder:
| TMPGEnc 2.512.52.161 - DVD PAL, Highest Quality: in s | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 161 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 168 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 185 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 199 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 211 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 249 | |
| P4 560 3,60 GHz DDR2-800 Intel 975X | 340 | |
Diesmal liegen die Conroes wieder geschlossen in Front, abgeschlagen ist der Single-Core Prozessor Pentium 4 560. Nun wandeln wir das selbe Quellvideo ein zweites Mal um, diesmal mit dem Windows Media Encoder 9.
Die Zieldatei im WMV-Format soll hochwertige 5384 kbit/s haben. Abermals messen wir die Sekunden, so daß kürzere Zeiten die bessere Leistung angeben:
| Windows Media Encoder 9 - WMV 5384 kbit/s: in s | ||
| Core2 Extreme X6800 2,93 GHz DDR2-800 Intel 975X | 492 | |
| Core2 Duo E6700 2,67 GHz DDR2-800 Intel 975X | 539 | |
| Core2 Duo E6600 2,40 GHz DDR2-800 Intel 975X | 594 | |
| Athlon64 X2@2,4 GHz DDR2-800 nF570SLI | 706 | |
| P4 EE965 3,73 GHz DDR2-800 Intel 975X | 781 | |
| Athlon64 X2@2,0 GHz DDR2-800 nF570SLI | 834 | |
| P4 560 3,60 GHz DDR2-800 | ||