"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

256MB PC1066 RIMMs von Kingston

Redphex 20.07.2002 15499 16
ktclogo.png
Das P4-Lager ist gespalten. Manche User setzen auf bewährte DDR-RAM Systeme und versuchen mit diesen glücklich zu werden, der Performance-Hunger der anderen ist unstillbar. Für die letzteren sind gerade die besten Rambus Speicher gut genug.
Hier werden die 256MB PC1066 Riegel von Kingston analysiert - zahlt sich eine Investition aus?

Die Vorstellung


Die Vorstellung

click to enlarge

click to enlarge
Waren Rambus-Speicher in ihrer ersten x86-Generation zu Zeiten des i820 Chipsets noch eher als sündteure Posh-Items mit nicht wirklich überzeugender Performance im Vergleich zu SDRAM verpöhnt, hat sich dieses Bild spätestens seit der Einführung des i850 Chipsets für den Pentium 4 stark relativiert und gewandelt. Denn Dank der stetig fallenden Preise und exzellenten Performance im Dual-Channel Betrieb wurde aus der teueren "Insellösung" ein auch für den Massenmarkt interessanter und vor allem für die performanceorientierten Endkunden höchst interessant.

Die ersten RIMM-Module wurden mit 600, 700 und 800 "MHz" (Rambus-ICs übertragen ebenso wie DDR-Speicher Datenpakete sowohl auf der steigenden als auch fallenden Signalflanke - die tatsächlichen Taktfrequenzen sind also halbiert) auf den Markt gebracht, derzeit ist die Technik auf 1066MHz vorgedrungen. Die dahinterstehende Architektur ist jedoch die gleiche geblieben: Diese unterscheidet sich von SDRAM und DDR-Speicher hauptsächlich in Bit-Breite und Geschwindigkeit des Speicherinterfaces. Während SDRAM auf einen mit 64bit auf einen breiten Bus aufbaut, verfügt RDRAM nur über ein 16bittiges Interface, das jedoch mit sehr hoher Taktrate operiert. Desweiteren besitzen RIMMs einen vom 8bittigen vom Datenbus getrennten Adressbus mit separaten Leitungen für die Zeilen- und Spaltenansteuerung, was schon neue Adressierungen erlaubt, während die Daten der letzten gerade übertragen werden.
Da jeder Rambus-Controller jedoch alle RIMMs und DRAMs seriell hintereinander anspricht, entstehen bauartbedingt trotz der sehr hohen Taktung relativ hohe Gesamtlatencies, die maximale Peak-Bandbreite relativiert diese jedoch einigermaßen: die aktuellen PC1066 Module bieten 2,1GB/s pro Channel - beim i850 Chipset also insgesamt 4,2GB/s.

About Kingston


About Kingston

click to enlarge
Die uns für diesen Artikel zur Verfügung gestellten 16bit Rambus-Module stammen von Kingston Technologies. Die in Kalifornien ansässige Firma ist der weltgrößte unabhängige Hersteller von Speicherprodukten rund um den PC. Die Palette reicht von Memory-Modulen für Desktops, Server, Notebooks, Druckern bis zu PDA's und Digitalkameras. Kingston's 2000 Produkte umfassendes Angebot hebt sich vor allem durch einen Punkt von der Konkurrenz ab: Kontinuierliche Tests schon während der Produktion bis zu umfangreichen Endkontrollen in den hauseigenen Quality Assurance Labs. So soll bestmögliche Kompatibilität der Speicherprodukte sichergestellt werden.
Unterstrichen wird dieser hohe Qualitätsanspruch durch die von Kingston gewährte Garantie - drei oder fünf Jahre bzw. lebenslang - je nach Produktkategorie. Darüberhinaus wird jedem Kunden bei Problemen freier technischer Support gewährt.


The System


The System

Auch wenn mit Intel's i850E Chipset der 133MHz quad-pumped Frontside-Bus offiziell supported wird, wurde dessen Speicherinterface von "Chipzilla" nicht für die erhöhte Geschwindigkeit rezertifiziert. Es liegt also im Ermessen der Mainboardhersteller, PC1066 Memory-Support zu testen und für ihre Produkte freizugeben. Zwar bieten - verglichen mit der Flut an billigeren SDRAM-basierten Mainboards - nur wenige Hersteller Rambus-Boards an, nach und nach bringen diese aber ihre i850/PC1066 Boliden auf den Markt. Grund genug, um die aktuellen Möglichkeiten von PC-Systemen mit hochqualitativen Speichern unter die Lupe zu nehmen.
Die aktuellen KVR1066x16-8/256 RIMM-Module mussten sowohl im ASUS P4T533-C (i850E) als auch im altbewährten Abit TH7-II (i850) ihre Performance und Kompatibilität unter Beweis stellen.

Hier das Test-Setup im Detail:

Hardware:
2x KVR1066x16-8/256 PC1066 RIMMs
ASUS P4T533-C, BIOS-version 1005c
Abit TH7-II Raid, BIOS-version 7c, modifiziert mit 533MHz Rambus Taktgeneratoren von Texas Instruments
Pentium 4 (Northwood) 1.6GHz
Alpha PAL8942 Kühler mit 80x80 Delta-Fan
ASUS GeForce4Ti4600 Ultra Deluxe

Software:
OS: Windows 2000, Service Pack 2, DirectX 8.1
Drivers: Detonator 29.42, Intel inf-update & Application Accelerator

Benchmarks:
3DMark 2001SE Build 330
PCMark 2002
Quake 3 Arena (640x480)
SuperPi
Linpack
Sisoft Sandra (Memory Benchmark)


erste Benchmark-Ergebnisse


erste Benchmark-Ergebnisse

click to enlarge
Linpack

click to enlarge
PCMark

click to enlarge
Sandra

click to enlarge
SuperPi

click to enlarge
Quake 3

click to enlarge
3DMark
Um die Performance der Speicher evaluieren zu können, wurden die Benchmarks natürlich mit verschiedenen FSB-Speeds durchgeführt. Dies gibt zwar bei speicherorientierten Benchmarks einen guten Vergleichswert, bei Applikationen hingegen spiegelt aufgrund des mit dem fixen Multiplikators der Test-CPU und des damit mit dem FSB steigenden CPU-Taktes, der erzielte Wert mehr die Performance des Gesamtsystems wider.

In den hier zuerst angeführten synthetischen Memory-Benchmarks zeigt sich ganz eindeutig, welche theoretischen Reserven die Pentium4-i850 Plattform bietet, wenn sie mit den richtigen Speichern bestückt wird. Linpack zeigt sehr schön bis zu welcher Operation-size der Secondlevel-Cache der CPU ausschlaggebend für die Speicherperformance ist bzw. wann die RIMMs gefordert werden. Schon hier zeigt sich, wie sehr die Gesamtleistung vom höheren Multiplikator und damit höheren Durchsatz abhängig ist.
Ebensodeutlich wird dies bei den Speichertests von PCMark und Sisoft Sandra veranschaulicht. Während beim Linpack 133x4 und 150x3 noch gleichauf lagen, zieht das synchron getaktete System klar dem asynchronen davon.

Nur leicht anders stellt sich die Situation bei den cpuhungrigen Applikationsbenchmarks dar: Zwar erzielt hier höhere CPU-Geschwindigkeit klarerweise höhere Ergebnisse, bei gleichem CPU-Takt zeigt sich aber auch hier wieder eindrucksvoll die mögliche weitere Performancesteigerung bei entsprechender Speicherperformance.

Overclock it!


Overclock it! ... die Grenzen werden ausgelotet.

click to enlarge
Wcpuid @180

click to enlarge
SuperPi @180

click to enlarge
Sandra @180

click to enlarge
3DMark @175
Wie schon bei den Benchmarks der vorigen Seite zu sehen war, wurden die Kingston-Speicher bei den Tests auf 600MHz betrieben. Denjenigen, die aufgrund der gezeigten PC1200-Performance schon zum Frohlocken neigen, sei jedoch schonend nahegebracht, daß diese Geschwindigkeit über Laufzeit _nicht_ stabil erreicht werden konnte. Das absolut stabile Maximum der Speichermodule war auf beiden verwendeten Mainboards bei 580MHz erreicht, was einem zum RAM synchronen FSB von 145MHz entspricht. Holicho's (.jp - holicho.lib.net) Tests zeigen jedoch regelmäßig, daß mit Erhöhung der RIMM-Versorgungsspannung oft noch mehr erreichbar ist.

Bei asynchron getakteten Speichern ist es angesichts der gebotenen Performance jedoch möglich, die absoluten overclocking-Obergrenzen eines jeden P4-Northwoods auszuloten. Im konkreten Fall durfte der hauseigene 1.6GHz Northwood zeigen, wo seine Limits mit Luftkühlung liegen. Das theoretische durch die PC1066-RIMMs gesetzte Limit lag hier bei 580/3=193,3MHz FSB respektive 3088MHz.
Ein Wert, der jeden verständigen Overclocker klarerweise zweifeln lässt ...

Die tatsächlich erreichten Resultat braucht sich jedoch auch nicht wirklich verstecken: Im TH7-II betrieben, gekühlt durch den derzeit wohl stärksten Kühler für Socket-478 CPU's - den Alpha PAL8942 mit 80x80 Delta-Lüfter, konnten mittelfristig stabile (manueller Prime-95 Abbruch nach 17 Stunden) 2800MHz erzielt werden! Bei 180MHz FSB war zwar auch noch der Windows-Betrieb möglich, nach kurzfristiger Belastung waren jedoch Fehler an der Tagesordnung. Außerdem produzierte die CPU mit den hierfür nötigen effektiven 2V+ weit mehr Hitze als der Kühler abführen konnte.
Die Screenshots sind jedoch alleine schon wegen den netten Scores einen Blick wert ;).


Fazit


Fazit

Auch wenn der Preis der PC1066 Module derzeit auf den potentiellen Käufer wohl eher einschüchternd wirkt - vor allem verglichen mit Billig-DDR DIMMS, so lehren die praktischen Performancewerte, die mit Rambus-Speichern erzielt werden, daß man eher genau überlegen sollte, wo gespart wird. Die als einzige derzeit in .at erhältlichen Kingston KVR1066x16-8/256 bieten dem Besitzer nicht nur hervorragende Performance für high-end Computersysteme, sondern auch den Komfort des exzellenten technischen Supports, falls es bei der Installation oder dem Betrieb zu Problemen kommen sollte. Spezieller Dank gebührt meinem Support-Contact Marco Biermann - so schnelle und kompetente persönliche Hilfestellung sucht man bei vielen anderen Firmen vergeblich. Mein Dank gilt auch Jutta Mücke bei der Werbeagentur http://www.interprom.de, die die Teststellung der Speicher koordinierte.
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz