"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

Machine Learning Rechner

charmin 16.02.2022 - 17:29 5588 32
Posts

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13879
Servus Forum,

Bin gerade am zusammenstellen von einem Data Science Rechner für die Firma:

Möglichst billig, Forschungsunternehmen, nicht kommerziell. Is unter anderem für meine Masterarbeit und halt alles was so an deep learning etc anfällt bei uns.

Hab mal folgendes zusammengestellt:

https://geizhals.at/?cat=WL-2428828


Gibts Verbesserungspotential?

Netzteil ausreichend? (soll irgendwann mal 3 oder 4 3090er dablasen, vorerst mal 2 3090er)
Mainboard Anschlüsse sind sehr knapp beinander, wird sich mit den triple slot karten net ausgehen? was dann? dual slot 3090er gibts net wirklich.


Bitte um Hilfe,
Danke !

Viper780

Moderator
Er ist tot, Jim!
Avatar
Registered: Mar 2001
Location: Wien
Posts: 48893
Willst du wirklich da was selbst schrauben?
Das Teil wird so und anders nicht leise werden - würde da auf ein Fancy Gehäuse und Noctua Lüfter eher verzichten.

CPU ist halt nicht mehr Taufrisch - kommts dir mehr auf Multicore oder Singlecore drauf an?

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13879
Nein ich Bau das nicht selber. Brauch aber nen Anhaltspunkt.

Ich brauche einfach nur Ne CPU mit Cores ab 16 und ein Mainboard wo ich 4 GPUs reinbring. Mehr Ned.

Viper780

Moderator
Er ist tot, Jim!
Avatar
Registered: Mar 2001
Location: Wien
Posts: 48893
Du wirst bei größeren Hersteller sowas eher mit Epyc oder Xeon CPU finden.
Persönlich würd ich wohl auf eine Threadripper Plattform gehen.

Aber im Grunde wirst du wohl zu euren Hardware Partner pilgern und ihm sagen du brauchst was mit vielen Cores und Platz für 4x RTX3090
Der reibt sich die Hände und wird dir genau eine Option anbieten können.

Dune

Here to stay
Registered: Jan 2002
Location: Wien
Posts: 9535
Kenn mich mit den neuen Quadros nicht aus, aber sind die für number cruncher die ewig laufen nicht wesentlich besser geeignet?

Die 3090 ist stark überzüchtet und hat ja gern mit dem Speicher Probleme, also ich würde die nicht in den Berechnungsserver packen. Abwärme auch Hardcore.

Vielleicht nicht sogar Cloud Computing?

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13879
Cloud Computing is Schweineteuer und hat noch andere Nachteile. Wir wollen jetzt weg davon.

Nvidia A10 oder A6000 haben wir auch im Auge. Kostet halt das doppelte und ist damit ausserhalb unserer Range.
Ganz zu schweigen von Tesla v100....

A5000 geht vom Preis her, aber is halt um ein Drittel langsamer als ne 3090 bei gleichem Preis.

@Viper780. Wir würden eh zum lorentschitsch gehen und das dort planen und bauen lassen. Mir geht's Mal nur um den ungefähren Preis und was möglich ist.

COLOSSUS

Administrator
Frickler
Avatar
Registered: Dec 2000
Location: ~
Posts: 11901
Ich wuerde mir gebrauchte Serverhardware mit ausreichend PCIe-Slots und -Lanes kaufen, und den bunten RGB-Speicher mit Gaming-Hardware stecken lassen. http://www.serverschmiede.com hat bspw. recht attraktive Barebones im Angebot, die man nach Lust und Laune konfigurieren kann.

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13879
Der bunte RGB Speicher is mir wurscht, das war einfach nur der billigste.

Keine Ahnung ob der lorentschitsch was gebrauchtes auch hat.

Ich möcht einfach nur wissen was ich ungefähr nehmen kann. Aber gut, dann werd ich mirein Angebot erstellen lassen, hab gedacht ich kann's vorher einfach abschätzen.

Aber bevor wir eine a6000 nehmen kaufen wir gar keinen Rechner. Budget ist nunmal unter 10k€, 24 GB VRAM is ein muss, sonst muss ich die batchsize so runternudeln und das Training dauert ewig weilst ständig den Gradienten berechnen musst.

mr.nice.

endlich fertig
Avatar
Registered: Jun 2004
Location: Wien
Posts: 6300
Imho irgendeine Förderung abstauben und eine DGX Station holen. Der große Sprung macht sich bei 4 GPUs bemerkbar und da können dann längere Zeit mehrere Leute davon profitieren.

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13879
Zitat aus einem Post von mr.nice.
Imho irgendeine Förderung abstauben und eine DGX Station holen. Der große Sprung macht sich bei 4 GPUs bemerkbar und da können dann längere Zeit mehrere Leute davon profitieren.

welche förderungen gibts da?
und DGX, sind die nicht völlig über unserem budget von 10k ?

mr.nice.

endlich fertig
Avatar
Registered: Jun 2004
Location: Wien
Posts: 6300
Forschungsunternehmen in Salzburg? Ich würde mich mal in der research community umhören, ob es da einen Badarf gibt, bzw. ob es nicht schon vorhandene ressourcen gibt, in die man sich vielleicht einmieten kann.
Bearbeitet von mr.nice. am 16.02.2022, 22:01

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13879
Genau ja, Forschungsunternehmen in Salzburg.

Naja das Ding ist halt, dass wir eigentlich jetzt was eigenes wollen und nicht mehr irgendwo einmieten. Derzeit haben wir einen Cloud dienst und der kostet dementsprechend und wennst dann ewig lang Point Clouds rüberschieben kannst, dann macht das einfach keinen Spaß.
Und davon werden wir in nächster Zeit sehr sehr viel machen und davon immer wieder neue Daten.

Die FH hat sich einen recht netten 30K Rechner gekauft, aber dort isses dasselbe wie auf der Uni in Salzburg. Wird nicht geteilt, da ausgelastet und auch Masterarbeiten drauf laufen.

Aber nochmal, wir suchen einfach was günstigeres und endlich was eigenes:

Die hier bietens ja auch an:

https://lambdalabs.com/gpu-workstat...ector/customize

und da geht sich eine threadripper workstation mit 2 3090er ohne probleme mit 10k netto aus.

Glaubts mas, ich hätt auch gerne nen ordentlichen cluster :D

Rogaahl

Super Moderator
interrupt
Avatar
Registered: Feb 2014
Location: K
Posts: 2076
Zitat aus einem Post von charmin
Der bunte RGB Speicher is mir wurscht, das war einfach nur der billigste.

Ich würde auch unbedingt ECC nehmen für sowas. Gab da einen guten post von Linus diesbezüglich. iirc hat man nach 24h eine 95% Chance auf einen bit flip bei 16GB befüllten RAM, wegen kosmische Strahlung. Ich glaube nicht das ihr solche Fehler in euren Modellen haben wollt, vor allem wenn man bedenkt das die sets oft über Jahre und Generationen weitergeführt wird.

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13879
Zitat aus einem Post von Rogaahl
Ich würde auch unbedingt ECC nehmen für sowas. Gab da einen guten post von Linus diesbezüglich. iirc hat man nach 24h eine 95% Chance auf einen bit flip bei 16GB befüllten RAM, wegen kosmische Strahlung. Ich glaube nicht das ihr solche Fehler in euren Modellen haben wollt, vor allem wenn man bedenkt das die sets oft über Jahre und Generationen weitergeführt wird.

Hab ich mir auch schon überlegt, aber was kann passieren?
Die Verbindungen zwischen den Neuronen werden für eine Berechnung im Batch falsch berechnet und der Fehler wandert kurz in eine Falsche Richtung, nur damit er beim nächsten Batch wieder in die richtige wandert.

Aber reine Mutmaßung und richtig auskennen tu ich mich auch nicht mit ECC RAm. kost ECC überhaupt soviel mehr?

Viper780

Moderator
Er ist tot, Jim!
Avatar
Registered: Mar 2001
Location: Wien
Posts: 48893
Ich hab genau sowas vor 10-15 Jahren auf der Uni gemacht und ich kann nur dringend vor "custombuilds" abraten.
Auch ein Händler verkauft dir da genau einen "One Time Build" den er nicht supporten kann.

Mit 10k kommst du dafür nicht aus. Nicht wenn du Support und eine stabile Maschine willst.

Egal was du berechnest oder simulierst du willst unbedingt ECC Speicher haben (RAM wie auch Grafikspeicher) du bekommst sonst einen Drift in deine Daten und komische Ausreißer die du nicht erklären kannst
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz