"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

SinusGPU - Micro-Benchmarken fuer die Wissenschaft!

COLOSSUS 25.09.2017 - 20:24 4862 18 Thread rating
Posts

COLOSSUS

Administrator
Frickler
Avatar
Registered: Dec 2000
Location: ~
Posts: 11902
Hi!

Ein guter Freund von mir arbeitet gerade an seinem ersten eigenen Projekt nach dem Abschluss des Doktorats aus Mathematik. Dafuer muss er ein aufwendig zu berechnendes Problem loesen - und hat dazu ein Programm geschrieben, das eine aktuelle High-End-GPU einige Monate bis Jahre voll auslasten wird. Jetzt moechte er gerne rausfinden, welche Karten/GPU-Architekturen fuer den in seine Berechnung involvierten GPU-Shader am besten geeignet sind. Auf meine Bitte hin ein hat er dafuer ein Micro-Benchmark aus seinem eigentlichen Programm herausgeloest, das diese Frage mit eurer Mithilfe hoffentlich empirisch beantwortbar macht. Ich habe ihm versprochen, es auf OC.at zu posten, weil weil es hier eifrige Rekordjaeger mit einer riesigen Vielfalt an Hardware gibt - die sicherlich bei der Entscheidungsfindung, wofuer ein Teil des Projektbudgets letztendlich draufgehen soll, helfend beistehen koennen (und hoffentlich wollen) :)

Nachdem mein Freund kein geuebter Applikationsentwickler ist, ist die Anwendung bzw. das Benchmark in der Handhabung nicht wahnsinnig bequem - es ist ein Windows-CLI-Programm, das kurz nach dem Starten auf unseren NVIDIA-GPUs unter Windows 7 und Windows 10 dazu fuehrt, dass der "Timeout Detection & Recovery (TDR)"-Mechanismus des Grafiktreibers aktiv wird, und den Benchmark-Prozess erbarmungslos erdolcht. Deswegen ist es vor dem Ausfuehren des Benchmarks notwendig, das Default-Timeout fuer TDR (es betraegt ab Werk etwa 2 (zwei) Sekunden, soweit ich das gesehen habe) ueber die Registry entweder auszer Kraft zu setzen, oder drastisch anzuheben, und dann den Host zu rebooten. (Weiter unten findet ihr einen Link zu einem Registry-Patch, der das Timeout auf meiner Kiste auf 255 Sekunden anhebt.) Danach laeuft SinusGPU.exe auf meiner GeForce 970 problemlos durch, und ich erhalte ein verwertbares Ergebnis. Ob das fuer AMD/Radeon-User auch ein Problem ist, weisz ich nicht - ich waere jedenfalls sehr gespannt auf eure Rueckmeldungen! :)


Falls jemand von euch beim Ermitteln der geeignetsten GPU mitmachen moechte, dann bitte:

  1. (Evtl. nur fuer NVIDIA-User relevant?) Ladet den TDR-Registry-Fix runter und wendet ihn mit einem Rechtsklick und "Zusammenfuehren" an → https://johannes.truschnigg.info/upload/TdrDelayFix.reg
  2. (Nur, falls ihr den TDR-Registry-Fix angewandt habt.) Rebootet euren PC
  3. Ladet das SinusGPU.zip-Archiv herunter und entpackt es → https://johannes.truschnigg.info/upload/SinusGPU.zip
  4. Startet SinusGPU.exe waehrend die Maschine ansonsten vollstaendig idle ist, und wartet, bis es fertig gerechnet hat (meine GeForce 970 rechnet ~50 Sekunden - es kann sein, dass das Bild waehrend des Durchlaufs scheinbar "einfriert"; das ist kein Grund zu Panik ;))
  5. Postet einen Screenshot des SinusGPU-Fensters in diesen Thread und/oder die Daten daraus textuell, und gebt dabei detailliert Auskunft ueber die verwendete Grafikkarte, Betriebssystem und Treiberversion

Vielen herzlichen Dank fuer eure Hilfe! :ghug:

Mein Freund hat noch diese kurze Erklaerung der Ausgabe (Screenshot von einem Durchlauf am Windows 7-Laptop mit einer NVIDIA Mobile GPU) beigelegt ;)
sinusgpu_225833.png

userohnenamen

leider kein name
Avatar
Registered: Feb 2004
Location: -
Posts: 15844
hier bitte
Windows 10 E 1703, Geforce GTX 980 TI, 22.21.13.8476 (bzw. 384.76) vom 27.06.2017

wlkikiv
Code:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)

Compiling program
Creating buffer
Starting computation

0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4

25.09.2017, 21:04:15:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 32935
Bearbeitet von userohnenamen am 25.09.2017, 21:13

argh

Here to stay
Avatar
Registered: Feb 2002
Location: Mödling
Posts: 803
Win 10 Pro, Version 1703
Sapphire RX 470, 8gb
1260 GPU Takt, 2100 VRAM.
Driver Packaging Version 17.10.3211-170606a-314971E-CrimsonReLive

Code:
Max global work group sizes, x: 65535, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1024, y: 1024, z: 1024
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1024
(minimum is 1024)

Compiling program
Creating buffer
Starting computation

0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4

25.09.2017, 20:58:14:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 418.46475
esup = 0.051325545
time = 83907

erlgrey

formerly known as der~erl
Registered: Aug 2002
Location: Wien
Posts: 4367
Win 10 pro, Version 1703
R9-290 tri-x 4gb (standard 1000-1300)
Crimson 17.9.2


Code:
Max global work group sizes, x: 65535, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1024, y: 1024, z: 1024
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1024
(minimum is 1024)

Compiling program
Creating buffer
Starting computation

0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4

25.09.2017, 20:59:17:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 418.46475
esup = 0.051325545
time = 110322

Enter anything to close.

btw. crash ohne tdrfix auch hier.

argh

Here to stay
Avatar
Registered: Feb 2002
Location: Mödling
Posts: 803
Zitat aus einem Post von der~erl
btw. crash ohne tdrfix auch hier.


stimmt, hatte ich vergessen zu posten. also trifft es auch auf amd zu.

COLOSSUS

Administrator
Frickler
Avatar
Registered: Dec 2000
Location: ~
Posts: 11902
Wow, danke schon einmal fuer die Resultate! :)


Der vollstaendigkeit halber der Score meines Spiele-Rechners:


Windows 10 Pro x86_64/17.03
NVIDIA GeForce 970 4GB, Treiber in Version 385.69:

Code:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)

Compiling program
Creating buffer
Starting computation

0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4

25.09.2017, 21:10:44:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 45309

Enter anything to close.


Edith meint noch: Ich hab offengestanden keine Ahnung, was genau berechnet wird - aber wie der eine Wert zwischen NVIDIA und AMD zu "springen" scheint macht mir irgendwie Sorgen, dass der Shader nicht mit beiden Treibern das selbe berechnet :D Ich werde das mal zu erfragen suchen...

semteX

Risen from the banned
Avatar
Registered: Oct 2002
Location: Pre
Posts: 14340
Code:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)

Compiling program
Creating buffer
Starting computation

0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4

25.09.2017, 21:11:49:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 39687

Enter anything to close.

GTX 970 auf 1.5ghz übertaktet. keine crashes, auch ohne fix

böhmi

Administrator
Spießer
Avatar
Registered: May 2004
Location: Wels Land
Posts: 4498
Code:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535 
(minimum is x: 65535, y: 65535, z: 65535) 
Max local work group sizes, x: 1536, y: 1024, z: 64 
(minimum is x: 1024, y: 1024, z: 64) 
Max local shader invocations: 1536 
(minimum is 1024) 

Compiling program 
Creating buffer 
Starting computation 

0: 0, 1, 2, 3, 4 
1: 0, 1, 2, 3, 4 
2: 0, 1, 2, 3, 4 
3: 0, 1, 2, 3, 4 
4: 0, 1, 2, 3, 4 

25.09.2017, 22:24:40: 
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800: 
dsup = 181.80855 
esup = 418.50751 
time = 25334 

Enter anything to close.

1080Ti

Hampti

Overclocking Team Member
Avatar
Registered: Feb 2004
Location: Wien
Posts: 4153
Ok man sieht gleich dass NV hier eindeutig die Nase vorne hat.

DAO

Si vis pacem, para bellum
Avatar
Registered: Mar 2001
Location: Austria
Posts: 4909
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)

Compiling program
Creating buffer
Starting computation

0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4

25.09.2017, 22:35:33:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 80998

Enter anything to close.

Quadro M4000M -> Thinkpad
OS: Win 10 Enterprise 10.0.15063]
Bearbeitet von DAO am 25.09.2017, 22:41

Crash Override

BOfH
Registered: Jun 2005
Location: Germany
Posts: 2951
1080 auf 50% TDP Limit ohne fix:

Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)

Compiling program
Creating buffer
Starting computation

0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4

25.09.2017, 22:58:30:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 24528

Enter anything to close.

100% TDP:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)

Compiling program
Creating buffer
Starting computation

0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4

25.09.2017, 22:52:46:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 21299

Enter anything to close.

116% TDP, +150Mhz:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)

Compiling program
Creating buffer
Starting computation

0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4

25.09.2017, 23:00:42:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 19938

Enter anything to close.
Bearbeitet von Crash Override am 25.09.2017, 23:01

Garbage

Administrator
The Wizard of Owls
Avatar
Registered: Jul 2000
Location: GR.ch|TI.ch
Posts: 11224
Zitat aus einem Post von Hampti
Ok man sieht gleich dass NV hier eindeutig die Nase vorne hat.
Kann sein, oder auch nicht.
Man sieht ja, dass die Ergebnisse zwischen Nvidia und AMD Karten nicht ident sind, somit hats hier was.
Und was bei Architektur N gut funktioniert, muss nicht zwangsläufig auch bei A gut sein.
Da müsste man wohl direkt auf unterschiedliche Architekturen hin optimieren.

smashIt

master of disaster
Avatar
Registered: Feb 2004
Location: OÖ
Posts: 5020
Zitat aus einem Post von COLOSSUS
Hi!
Dafuer muss er ein aufwendig zu berechnendes Problem loesen - und hat dazu ein Programm geschrieben, das eine aktuelle High-End-GPU einige Monate bis Jahre voll auslasten wird.

rein aus interesse:
gibts ein paar mehr infos zu dem problem?

ergebnisse von meiner hd7850 werden wohl nicht intressant sein :)

Denne

Here to stay
Avatar
Registered: Jan 2005
Location: Germany
Posts: 2801
Windows 10 (64bit), Xeon E3-1230 v3, Geforce GTX 1070 (Treiberversion: 385.41)
Den TDR-Registry-Fix musste ich btw nicht anwenden, ging auch ohne problemlos.


Code:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)

Compiling program
Creating buffer
Starting computation

0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4

26.09.2017, 09:57:57:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 26616

Enter anything to close.

wergor

connoisseur de mimi
Avatar
Registered: Jul 2005
Location: graz
Posts: 4027
GTX 780
ForceWare 382.05 WHQL
Windows 10 Pro N 15063.608
Code:
Max global work group sizes, x: 2147483647, y: 65535, z: 65535
(minimum is x: 65535, y: 65535, z: 65535)
Max local work group sizes, x: 1536, y: 1024, z: 64
(minimum is x: 1024, y: 1024, z: 64)
Max local shader invocations: 1536
(minimum is 1024)

Compiling program
Creating buffer
Starting computation

0: 0, 1, 2, 3, 4
1: 0, 1, 2, 3, 4
2: 0, 1, 2, 3, 4
3: 0, 1, 2, 3, 4
4: 0, 1, 2, 3, 4

26.09.2017, 21:40:09:
a = 5, w = 2, d = 2, mg = 800, mb = 800, my = 800:
dsup = 181.80855
esup = 418.50751
time = 61961

Enter anything to close.
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz