URL: https://www.overclockers.at/grafikkarten/nvidia_physx_cpu-benachteiligung_belegt_217434/page_1 - zur Vollversion wechseln!
ZitatPhysX ist auf Nvidias Geforce-Grafikkarten deutlich schneller als auf Prozessoren. Eine neue Analyse zieht den Schluss, dass dies auch am Programmcode für die CPU-Version liegt.
Auf techreport stand gestern ähnliches.
SSE soll ca. 1.5-2x schneller sein als x87 und da derzeit nur ein Kern für Physics genutzt wird, kann man sich leicht ausrechnen, was auf einem 4-Kerner + richtiger Optimierung möglich wäre.
Nvidias wird sich aber ihr derzeit wichtigstes Argument, neben der schnelleren Tesselation, gegen ATI`s 5***er Serie nicht durch irgendwelche Optimierungen selbst zerstören.
warum solltens auch den code für die cpu optimieren wenn sie am liebsten ne seperate gpu dafür im einsatz sehen
Ich hab die Primaerquelle nicht angezapft, aber zumindest "(and frankly supporting SSE is easier than x87 anyway)" ist Bogus - beides ist lediglich ein Compiler-Flag (-mpfmath= bei GCC z. B.), auszer der Code ist wirklich Hand-Written Assembly. Was mich wundern wuerde, wenn NVIDIA nicht viel dran liegt, dass das ganze auf einer x86-CPU flott zu Werke geht
Deshalb war und bin ich nie ein freund von physx gewesen, die eigentliche novodex engien war für die damalige zeit wirklich gut aber wie aegia entschieden hat es in physx umzubennen um damit hardware zu verkaufen, wars aus...
Ich weiß nicht welcher und wie viel Code automatisch mit diesen Instruktionen kompiliert werden kann, aber eine ordentliche Umsetzung/Parallelisierung durch SSE setzt einige konzeptionelle Entscheidungen voraus, genauso wie zusätzlichen Code, um die neuen Register zu nutzen. Als schnelles Beispiel hab ich hier ein MatrixMultiply() gefunden.Zitat von COLOSSUSIch hab die Primaerquelle nicht angezapft, aber zumindest "(and frankly supporting SSE is easier than x87 anyway)" ist Bogus - beides ist lediglich ein Compiler-Flag (-mpfmath= bei GCC z. B.), auszer der Code ist wirklich Hand-Written Assembly. Was mich wundern wuerde, wenn NVIDIA nicht viel dran liegt, dass das ganze auf einer x86-CPU flott zu Werke geht
signed. wenn ich mein produkt verkaufen möchte, dann wäre ich blöd wenn physx auf cpus gleich/besser performen würde.Zitat von Nicowarum solltens auch den code für die cpu optimieren wenn sie am liebsten ne seperate gpu dafür im einsatz sehen
Das stimmt natuerlich, wenn man die SIMD-Einheiten moderner CPUs so gut es geht nutzen moechte.
Einen wirklich gut optimierenden Compiler vorausgesetzt wird man aber auch ohne manuelles Trimmen auf optimalen Ablauf unter Nutzung von SSE, AltiVec et al. nur durch entsprechendes Uebersetzen einen durchaus messbaren Unterschied erzielen koennen. ICC z. B. hat ja eine ziemlich gute Auto-Vectorization, was man so liest.
Zitat von COLOSSUSICC z. B. hat ja eine ziemlich gute Auto-Vectorization, was man so liest.
overclockers.at v4.thecommunity
© all rights reserved by overclockers.at 2000-2025