Bulldozer - oder ein anderer Ansatz für Multithread-Aufgaben
Joe_the_tulip 01.12.2009 - 00:24 3674 8
Joe_the_tulip
Vereinsmitgliedbanned by FireGuy
|
Während Intel mit Hyperthreading jedem Kern bis zu zwei Prozesse zuweist, geht AMD mit Bulldozer einen komplett anderen Weg. Das beginnt schon beim Zählen der Kerne: Ein Bulldozer-Modul hat bereits zwei Kerne zur Berechnung von Integers. » Beitrag lesen
|
smashIt
master of disaster
|
gut bei sun abgeschaut...
|
t3mp
I Love Gasoline
|
Erlaubt ist was Leistung bringt.
|
Castlestabler
Here to stay
|
Solange CUDA keine Konkurrenz aus dem eignen Haus bekommen, haben die TESLA-Karten immer mehr Berechtigung.
CPU nur für Integer und Float nur für die GPU, wenn sich nicht was ändert wird es wohl in diese Richtung laufen.
|
semteX
begehrt die rostschaufel
|
bevor das praktikable realität wird müssn sich die entwickler werkzeuge ändern. CUDA programmiern ist (noch) nicht ganz trivial.
|
Viper780
ElderEr ist tot, Jim!
|
Solange CUDA keine Konkurrenz aus dem eignen Haus bekommen, haben die TESLA-Karten immer mehr Berechtigung.
CPU nur für Integer und Float nur für die GPU, wenn sich nicht was ändert wird es wohl in diese Richtung laufen. scheint so und irgend wann fallen die wieder zusammen  Also mehr Integereinheiten würden mir shcon gefallen und wenn das die CPU bzw. ddie Kompiler auch gleich apssend aufteilen können ists noch besser
|
mat
AdministratorLegends never die
|
bevor das praktikable realität wird müssn sich die entwickler werkzeuge ändern. CUDA programmiern ist (noch) nicht ganz trivial. Noch nicht ganz? Abgesehen davon, dass das Programmieren damit pain-in-the-ass ist, sind nur die wenigsten Berechnungen wirklich parallelisierbar. Alles andere läuft nur auf einem einzigen CUDA-Core und ist dann weit langsamer als jede CPU. Welche Verbesserungen da der L2-Cache usw. für Fermi bringen wird, bleibt abzuwarten. Was die Zukunft bringt ist momentan sehr fraglich. Die engere Kooperation zwischen CPU und GPU könnte auch für Entwickler einen einfacheren Zugang zur GPU legen, um hoch parallelisierbare Aufgaben direkt in die Anwendung einbinden zu können. Ein gemeinsamer Zugang auf den Arbeitsspeicher macht das auch garantiert trivialer. Also könnte ich mir vorstellen, dass für maximale Leistung Fusion und Co GPGPU-Code ausführen würden, während diskrete Grafikkarten sich wie gewohnt um die Spielgrafik kümmern.
|
Burschi1620
24/7 Santa Claus
|
scheint so und irgend wann fallen die wieder zusammen 
|
Hornet331
See you Space Cowboy
|
Also mehr Integereinheiten würden mir shcon gefallen und wenn das die CPU bzw. ddie Kompiler auch gleich apssend aufteilen können ists noch besser Das wird bei amd a zeitl dauern wenns so gehandhabt wird wie dereziet. Soe haben zwar eigene kompiler... aber wenn der intel compiler besser ergebnisse liefert als der eigene ist irgend was falsch gelaufen... und gcc ist nur cool wenn ma einfach was crossplatformen möchte. Performance ist noch immer bescheiden... ok im gegensatz zum msc doch besser.  Ah ja btw, es sind 50% mehr die space statt der 5%. Ist interessant was sich durchsetzt, intels SMT braucht 5% mehr die space für ~30% mehr leistung, amd 50% mehr für 80%.
Bearbeitet von Hornet331 am 01.12.2009, 17:32
|