"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

AMD Ryzen Threadripper 3960X, 3970X und 3990X

blood 25.11.2019 - 15:53 23642 113
Posts

Master99

verträumter realist
Avatar
Registered: Jul 2001
Location: vie/grz
Posts: 12595
kann schon sein, dass sich das transcodieren von einem video nur bedingt parallelisieren lässt (videocodecs arbeiten ja mit inhaltlichen zeitliche abhängigkeiten zum vorderen/nachfolgenden frame, außer man verwendet i-frame only codierungen) ... aber es scheint hier ja sehr viel material parallel bearbeitet zu werden, da sollte es dann kein problem sein alle kerne gut auszulasten.

kann aber auch einfach dran liegen, dass bis vor kurzem die typischen entwickler dieser freien h26/265-alternativen einfach keine maschinen mit sovielen kernen zur verfügung gehabt haben.

InfiX

she/her
Avatar
Registered: Mar 2002
Location: Graz
Posts: 13713
also in den 4k handbrake banchmarks die ich gesehen hab liegt der TR3 schon deutlich vorn, auch wenn er nicht linear skaliert.

GrandAdmiralThrawn

XP Nazi
Avatar
Registered: Aug 2000
Location: BRUCK!
Posts: 3682
128 Threads lastest meiner Erfahrung nach nicht mehr so leicht aus mit x265, aber man kann den Encoder schon für Parallelisierung tunen. Mache ich natürlich nur da, wo damit auch eine Qualitätssteigerung einhergeht. Selbiges gilt für x264. Generell muß man aber sagen, daß es bei x265 schon sehr viele Interdependencies gibt, die Teile des Encoders dann zur Serialisierung zwingen. "Endlos skalieren" geht in der Tat nicht.

Aber das ist egal; Schick ich einfach mehrere Prozesse los.

Dieses "Multitarget" Encoding will ich aus Kompatibilitätsgründen so. Ein 4K Gerät ohne HDR spielt ein HDR Video zwar ab, aber das Ergebnis ist einfach grindig, komplett ausgewaschen, unbrauchbar. Man kann den Client natürlich bei der Wiedergabe zum Tonemappen anhalten (z.B. mit MadVR unter Windows), aber das frißt massiv GPU Ressourcen und erfordert detailreiche Konfig auf der Clientseite. Muß ned sein.

1080p ist nötig, weil nicht alle Wiedergabegeräte 4K so leicht schaffen. Im Prinzip "sollte" man diesen Teil auf 8-bit H.264/AVC belassen, wenn man wirklich kompatibel sein will, aber den Schwanz schneide ich doch einmal ab.

Verwendete Tools in meinem Fall:
  • Bash und Perl (Automatisierung für Steuerung von Batch Encoding und Multiplexing, auf Windows auch WinBatch)
  • mkvmerge, mkvextract, mkvinfo (MKVToolNix Suite für Multiplexing, Demultiplexing, Analyse)
  • mediainfo (Analyse)
  • ffmpeg+libzimg (Decoder, Tonemapper, Scaler, FLAC Audio Encoder, wo noch nötig auch Deinterlacer)
  • yuvkineco (Wo noch nötig, 2:3 Pulldown Reverter)
  • x264 (Video Encoder, Phase-out)
  • x265 (Video Encoder)
  • fhgaacenc (AAC-LC Audio Encoder via wine)
  • AegiSub (Untertitelverarbeitung)
  • OS: UNIX oder Linux (Aktuell: FreeBSD UNIX, Linux und Windows)

Meine SBS 3D Encoding Pipeline mit AviSynth war Windows-only, die habe ich jetzt weggeworfen, weil 3D eh am Aussterben ist.

Vielleicht sind noch irgendwelche Tools dabei, die mir grad ned einfallen, aber der größte Anteil an CPU Zeit entfällt auf x265, ganz klar.

mr.nice.

Moderator
endlich fertig
Avatar
Registered: Jun 2004
Location: Wien
Posts: 6303
GAT ich bin mir ziemlich sicher, dass ein Video transcoding mit gewissen Ansprüchen auf Effizienz, nicht über einen CCX-Cluster hinausgehen sollte, weil sonst viele Daten über den langsamen L3 Cache verschoben werden müssen. Sprich mit vier parallelen transcodings, jedes auf je einen CCX-Cluster isoliert, solltest einen 32 Kerner ziemlich optimal auslasten. Den 64 Kerner würde ich nur in Betracht ziehen, wenn du acht Videos parallel berechnen willst.

GrandAdmiralThrawn

XP Nazi
Avatar
Registered: Aug 2000
Location: BRUCK!
Posts: 3682
Du sprichst von Datentransfer/Bandbreite? Nachweislich sind x264/x265 aber so gut wie überhaupt nicht bandbreitengebunden (Über meine eigenen Benchmarkprojekte nachgewiesen). Ich kodiere ja jetzt schon mit bis zu 32 Threads (auch mit einem einzelnen Prozeß bei 4K/UHD), und das skaliert vorzüglich. Sowohl x264 als auch x265 haben da über die Jahre deutliche Fortschritte gemacht.

Worauf basierst du da deine Aussage? Benches/Links?

Garbage

Administrator
The Wizard of Owls
Avatar
Registered: Jul 2000
Location: GR.ch|TI.ch
Posts: 11225
Wenn ich es richtig in Erinnerung habe, war der 2990WX bei Handbrake/Encoding trotz NUMA eigentlich ganz gut unterwegs. Da könntest du vielleicht in Bälde einen guten Deal machen, denn die TR4/X399 Plattform wird sicher einen gewissen Abverkauf sehen.

Solltest du Interesse an einem FX-9590 als Ersatz für deine defekte CPU haben, ich habe noch einen liegen -> PM ;)

GrandAdmiralThrawn

XP Nazi
Avatar
Registered: Aug 2000
Location: BRUCK!
Posts: 3682
Ok, das tut mir jetzt echt weh.

Ich habe die komplette FX-9590 Maschine entsorgt. Das Mainboard wurde nach Deutschland verkauft (an einen Bekannten), der Rest der Müllentsorgung zugeführt oder ausgeschlachtet. Nur die defekte CPU liegt noch am Schreibtisch, als Memento.

Du kommst grade eine Woche zu spät. Sonst hätte ich dein Angebot sicher angenommen, einfach nur weil mir diese idiotische CPU irgendwie getaugt hat. Schade. :(

Aber: Den 2990WX kauf' ich sicher nicht. NUMA kann mich bei Single Socket gern haben, und sTRX40 soll langlebig werden (TR4 kann das nicht mehr), zudem ist Zen 2 einfach zu geil. ;)

mr.nice.

Moderator
endlich fertig
Avatar
Registered: Jun 2004
Location: Wien
Posts: 6303
https://www.phoronix.com/scan.php?p...3970x&num=8

Da hab ich gesehen, dass die vielen Kerne mit x265 nicht so gut skalieren, außer man parallelisiert mehrere encodings.

Vinci

hatin' on summer
Registered: Jan 2003
Location: Wien
Posts: 5775
Dass man für die v3 jetzt einen neuen Sockel braucht find ich als TR4 Besitzer nicht so prickelnd... Und die Preise für die neuen Brettln sind auch jenseits von gut und böse. Das günstigste sTRX4 Board is aktuell mit 460€ gelistet.

GrandAdmiralThrawn

XP Nazi
Avatar
Registered: Aug 2000
Location: BRUCK!
Posts: 3682
@mr.nice: Bei 1080p ok, nicht falsch. Aber x265 skaliert direkt mit Anzahl der CTUs (=quasi Macroblocks, oftmals 32×32 oder 64×64 Pixel groß) und Wavefronts (denke "Zeilen" aus mehreren CTUs).

Anders: x265 skaliert stark mit der Auflösung, vor allem der vertikalen. Und der von dir verlinkte Benchmark nutzt nur 1080p ohne nennenswertes CTU-Tuning, z.B. auf kleinere non-Standard 16×16 CTUs. Das kritisiere ich gerne bei so einigen x265 Benches, die oft genutzt werden, die sind nicht so parameterisiert, wie man es in der Praxis bei 1080p fahren würde.

Zudem sind die dicken Brummer die 4K/UHD Videos. Die benched komischerweise kaum einer, und wenn, dann nur mit vorhergehendem Downscale auf 1080p, also wieder eher unpassend. Mein selbst entworfener x265 Bench setzt sogar auf volles 16:9 8K (8192×4608) und tuned Parameterisierung, nur um die Skalierbarkeit auszureizen. Das ist zwar ehrlicherweise auch nicht praxisnah, aber für einen Ausblick auf die Zukunft etwas besser geeignet, als das HD Zeug.

Ich checks eh nicht ganz, wieso so viele x265 Benchmarks auf 1080p eingeschossen sind. Grade dieser Encoder ist von Grund auf für 4K getuned. Also sollte man auch mit 4K Inhalten benchmarken. Und da zieht dann auch eine CPU mit so vielen Kernen.

Ich schätze Mal, AMD hat hier einen Parcours vorgegeben? Kann das sein? Weil die meisten Webseiten benchen alle das gleiche, soweit ich das gesehen habe.

@Vinci: Klar, das wird wohl alle TR4 Nutzer nerven. Verstehe ich auch. Mir kann es egal sein, weil ich den 1950X und den 2990WX ausgesessen habe. Aber jo, das ist schon etwas wo ich mir sogar gedacht hätte, daß wesentlich heftigere Kritik kommen würde, als bisher gesehen.

Viper780

Moderator
Er ist tot, Jim!
Avatar
Registered: Mar 2001
Location: Wien
Posts: 48923
Aufrüsten ist bei Hedt noch seltener als bei Consumer Hardware.

Somit ist es nicht ganz so tragisch, aber ich fürchte TRX40 hält auch nur 2 Generationen und dann sind wir wieder beim selben Zyklus den Intel da fährt

Master99

verträumter realist
Avatar
Registered: Jul 2001
Location: vie/grz
Posts: 12595
bei AMD gabs jetzt mit der 3. threadripper generation zumindest triftige gründe (höher maximaler TDP sowie bis zu doppelt soviel Kerne) wohingegen bei intel gefühlt mind jeder 2. sockel reine geldmacherein war und sich eigentlich kaum was tat.

InfiX

she/her
Avatar
Registered: Mar 2002
Location: Graz
Posts: 13713
ich hab im prinzip eh nichts gegen die segmentierung zwischen TR4 und TRX4, ich hätt mir nur gewünscht, dass sie für den TR4 noch was bringen, der 3950x hätt da so schön gepasst :/

für TRX4 ist mir halt der einstiegspreis derzeit einfach noch zu hoch, und nachdem ich mit dem PC kein geld verdien ist es schwer die 24+ cores zu rechtfertigen.

zudem lacht mich noch kein TRX40 board so richtig an, die meisten boards wirken irgendwie wie ein rückschritt gegenüber TR4 und das trotz dem vorteil durch pcie gen4.

mein X399 hat 5 PCIe slots und 10G on board und das auf ATX... gibts nicht bei TRX40 z.b. nedmal auf EATX/XLATX zudem gefällt mir das M.2 placement unter der grafikkarte nicht auf den meisten boards.
Bearbeitet von InfiX am 27.11.2019, 02:01

GrandAdmiralThrawn

XP Nazi
Avatar
Registered: Aug 2000
Location: BRUCK!
Posts: 3682
Falls es jemanden interessiert, ich habe unterdessen ASRock angeschrieben, und gefragt, ob sie auch eine µATX Version für sTRX40 planen, weil es selbige für TR4 ja gegeben hat, mit dem Taichi X399M. Weil's mich halt interessiert.

Man sagte mir, daß man vorerst beim gegebenen Lineup bleiben würde, und daß die Entscheidung über eine µATX Platine noch nicht gefallen sei.

Ich denke Mal, da kommt eher nichts mehr. Das X399M war wohl ein Ladenhüter?

Master99

verträumter realist
Avatar
Registered: Jul 2001
Location: vie/grz
Posts: 12595
Werden sich wohl nur die wenigsten antun so leistungsfähige CPU's mit hoher Abwärme in ein mATX Gehäuse zu packen. Wenn man schon eine >=24Core CPU mit massig PCI-4Lanes hat dann will man das ja auch nutzen können.

Außerdem bleibt die zweite Threadripper-Generation als günstigere Variante vorerst auch am Markt.
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz