URL: https://www.overclockers.at/grafikkarten/sinusgpu-micro-benchmarken-fuer-die-wissenschaft_249751/page_1 - zur Vollversion wechseln!
Hi!
Ein guter Freund von mir arbeitet gerade an seinem ersten eigenen Projekt nach dem Abschluss des Doktorats aus Mathematik. Dafuer muss er ein aufwendig zu berechnendes Problem loesen - und hat dazu ein Programm geschrieben, das eine aktuelle High-End-GPU einige Monate bis Jahre voll auslasten wird. Jetzt moechte er gerne rausfinden, welche Karten/GPU-Architekturen fuer den in seine Berechnung involvierten GPU-Shader am besten geeignet sind. Auf meine Bitte hin ein hat er dafuer ein Micro-Benchmark aus seinem eigentlichen Programm herausgeloest, das diese Frage mit eurer Mithilfe hoffentlich empirisch beantwortbar macht. Ich habe ihm versprochen, es auf OC.at zu posten, weil weil es hier eifrige Rekordjaeger mit einer riesigen Vielfalt an Hardware gibt - die sicherlich bei der Entscheidungsfindung, wofuer ein Teil des Projektbudgets letztendlich draufgehen soll, helfend beistehen koennen (und hoffentlich wollen) 
Nachdem mein Freund kein geuebter Applikationsentwickler ist, ist die Anwendung bzw. das Benchmark in der Handhabung nicht wahnsinnig bequem - es ist ein Windows-CLI-Programm, das kurz nach dem Starten auf unseren NVIDIA-GPUs unter Windows 7 und Windows 10 dazu fuehrt, dass der "Timeout Detection & Recovery (TDR)"-Mechanismus des Grafiktreibers aktiv wird, und den Benchmark-Prozess erbarmungslos erdolcht. Deswegen ist es vor dem Ausfuehren des Benchmarks notwendig, das Default-Timeout fuer TDR (es betraegt ab Werk etwa 2 (zwei) Sekunden, soweit ich das gesehen habe) ueber die Registry entweder auszer Kraft zu setzen, oder drastisch anzuheben, und dann den Host zu rebooten. (Weiter unten findet ihr einen Link zu einem Registry-Patch, der das Timeout auf meiner Kiste auf 255 Sekunden anhebt.) Danach laeuft SinusGPU.exe auf meiner GeForce 970 problemlos durch, und ich erhalte ein verwertbares Ergebnis. Ob das fuer AMD/Radeon-User auch ein Problem ist, weisz ich nicht - ich waere jedenfalls sehr gespannt auf eure Rueckmeldungen! 
Falls jemand von euch beim Ermitteln der geeignetsten GPU mitmachen moechte, dann bitte:
)

hier bitte
Windows 10 E 1703, Geforce GTX 980 TI, 22.21.13.8476 (bzw. 384.76) vom 27.06.2017
wlkikiv
Code:Max global work group sizes, x: 2147483647, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1536, y: 1024, z: 64 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1536 (minimum is 1024) Compiling program Creating buffer Starting computation 0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4 25.09.2017, 21:04:15: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 181.80855 esup = 418.50751 time = 32935
Win 10 Pro, Version 1703
Sapphire RX 470, 8gb
1260 GPU Takt, 2100 VRAM.
Driver Packaging Version 17.10.3211-170606a-314971E-CrimsonReLive
Code:Max global work group sizes, x: 65535, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1024, y: 1024, z: 1024 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1024 (minimum is 1024) Compiling program Creating buffer Starting computation 0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4 25.09.2017, 20:58:14: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 418.46475 esup = 0.051325545 time = 83907
Win 10 pro, Version 1703
R9-290 tri-x 4gb (standard 1000-1300)
Crimson 17.9.2
Code:Max global work group sizes, x: 65535, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1024, y: 1024, z: 1024 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1024 (minimum is 1024) Compiling program Creating buffer Starting computation 0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4 25.09.2017, 20:59:17: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 418.46475 esup = 0.051325545 time = 110322 Enter anything to close.
Zitat aus einem Post von der~erlbtw. crash ohne tdrfix auch hier.
Wow, danke schon einmal fuer die Resultate! 
Der vollstaendigkeit halber der Score meines Spiele-Rechners:
Windows 10 Pro x86_64/17.03
NVIDIA GeForce 970 4GB, Treiber in Version 385.69:
Code:Max global work group sizes, x: 2147483647, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1536, y: 1024, z: 64 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1536 (minimum is 1024) Compiling program Creating buffer Starting computation 0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4 25.09.2017, 21:10:44: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 181.80855 esup = 418.50751 time = 45309 Enter anything to close.
Ich werde das mal zu erfragen suchen...Code:Max global work group sizes, x: 2147483647, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1536, y: 1024, z: 64 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1536 (minimum is 1024) Compiling program Creating buffer Starting computation 0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4 25.09.2017, 21:11:49: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 181.80855 esup = 418.50751 time = 39687 Enter anything to close.
Code:Max global work group sizes, x: 2147483647, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1536, y: 1024, z: 64 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1536 (minimum is 1024) Compiling program Creating buffer Starting computation 0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4 25.09.2017, 22:24:40: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 181.80855 esup = 418.50751 time = 25334 Enter anything to close.
Ok man sieht gleich dass NV hier eindeutig die Nase vorne hat.
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
25.09.2017, 22:35:33:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 80998
Enter anything to close.
Quadro M4000M -> Thinkpad
OS: Win 10 Enterprise 10.0.15063]
1080 auf 50% TDP Limit ohne fix:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
25.09.2017, 22:58:30:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 24528
Enter anything to close.
100% TDP:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
25.09.2017, 22:52:46:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 21299
Enter anything to close.
116% TDP, +150Mhz:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)
Compiling program
Creating buffer
Starting computation
0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4
25.09.2017, 23:00:42:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 19938
Enter anything to close.
Kann sein, oder auch nicht.Zitat aus einem Post von HamptiOk man sieht gleich dass NV hier eindeutig die Nase vorne hat.
Zitat aus einem Post von COLOSSUSHi!
Dafuer muss er ein aufwendig zu berechnendes Problem loesen - und hat dazu ein Programm geschrieben, das eine aktuelle High-End-GPU einige Monate bis Jahre voll auslasten wird.

Windows 10 (64bit), Xeon E3-1230 v3, Geforce GTX 1070 (Treiberversion: 385.41)
Den TDR-Registry-Fix musste ich btw nicht anwenden, ging auch ohne problemlos.
Code:Max global work group sizes, x: 2147483647, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1536, y: 1024, z: 64 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1536 (minimum is 1024) Compiling program Creating buffer Starting computation 0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4 26.09.2017, 09:57:57: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 181.80855 esup = 418.50751 time = 26616 Enter anything to close.
GTX 780
ForceWare 382.05 WHQL
Windows 10 Pro N 15063.608
Code:Max global work group sizes, x: 2147483647, y: 65535, z: 65535 (minimum is x: 65535, y: 65535, z: 65535) Max local work group sizes, x: 1536, y: 1024, z: 64 (minimum is x: 1024, y: 1024, z: 64) Max local shader invocations: 1536 (minimum is 1024) Compiling program Creating buffer Starting computation 0: 0, 1, 2, 3, 4 1: 0, 1, 2, 3, 4 2: 0, 1, 2, 3, 4 3: 0, 1, 2, 3, 4 4: 0, 1, 2, 3, 4 26.09.2017, 21:40:09: a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: dsup = 181.80855 esup = 418.50751 time = 61961 Enter anything to close.
overclockers.at v4.thecommunity
© all rights reserved by overclockers.at 2000-2025