charmin
Super Moderator
|
Servus Forum, Bin gerade am zusammenstellen von einem Data Science Rechner für die Firma: Möglichst billig, Forschungsunternehmen, nicht kommerziell. Is unter anderem für meine Masterarbeit und halt alles was so an deep learning etc anfällt bei uns. Hab mal folgendes zusammengestellt: https://geizhals.at/?cat=WL-2428828Gibts Verbesserungspotential? Netzteil ausreichend? (soll irgendwann mal 3 oder 4 3090er dablasen, vorerst mal 2 3090er) Mainboard Anschlüsse sind sehr knapp beinander, wird sich mit den triple slot karten net ausgehen? was dann? dual slot 3090er gibts net wirklich. Bitte um Hilfe, Danke !
|
Viper780
ModeratorEr ist tot, Jim!
|
Willst du wirklich da was selbst schrauben? Das Teil wird so und anders nicht leise werden - würde da auf ein Fancy Gehäuse und Noctua Lüfter eher verzichten.
CPU ist halt nicht mehr Taufrisch - kommts dir mehr auf Multicore oder Singlecore drauf an?
|
charmin
Super Moderator
|
Nein ich Bau das nicht selber. Brauch aber nen Anhaltspunkt.
Ich brauche einfach nur Ne CPU mit Cores ab 16 und ein Mainboard wo ich 4 GPUs reinbring. Mehr Ned.
|
Viper780
ModeratorEr ist tot, Jim!
|
Du wirst bei größeren Hersteller sowas eher mit Epyc oder Xeon CPU finden. Persönlich würd ich wohl auf eine Threadripper Plattform gehen.
Aber im Grunde wirst du wohl zu euren Hardware Partner pilgern und ihm sagen du brauchst was mit vielen Cores und Platz für 4x RTX3090 Der reibt sich die Hände und wird dir genau eine Option anbieten können.
|
Dune
Here to stay
|
Kenn mich mit den neuen Quadros nicht aus, aber sind die für number cruncher die ewig laufen nicht wesentlich besser geeignet?
Die 3090 ist stark überzüchtet und hat ja gern mit dem Speicher Probleme, also ich würde die nicht in den Berechnungsserver packen. Abwärme auch Hardcore.
Vielleicht nicht sogar Cloud Computing?
|
charmin
Super Moderator
|
Cloud Computing is Schweineteuer und hat noch andere Nachteile. Wir wollen jetzt weg davon.
Nvidia A10 oder A6000 haben wir auch im Auge. Kostet halt das doppelte und ist damit ausserhalb unserer Range. Ganz zu schweigen von Tesla v100....
A5000 geht vom Preis her, aber is halt um ein Drittel langsamer als ne 3090 bei gleichem Preis.
@Viper780. Wir würden eh zum lorentschitsch gehen und das dort planen und bauen lassen. Mir geht's Mal nur um den ungefähren Preis und was möglich ist.
|
COLOSSUS
AdministratorFrickler
|
Ich wuerde mir gebrauchte Serverhardware mit ausreichend PCIe-Slots und -Lanes kaufen, und den bunten RGB-Speicher mit Gaming-Hardware stecken lassen. http://www.serverschmiede.com hat bspw. recht attraktive Barebones im Angebot, die man nach Lust und Laune konfigurieren kann.
|
charmin
Super Moderator
|
Der bunte RGB Speicher is mir wurscht, das war einfach nur der billigste.
Keine Ahnung ob der lorentschitsch was gebrauchtes auch hat.
Ich möcht einfach nur wissen was ich ungefähr nehmen kann. Aber gut, dann werd ich mirein Angebot erstellen lassen, hab gedacht ich kann's vorher einfach abschätzen.
Aber bevor wir eine a6000 nehmen kaufen wir gar keinen Rechner. Budget ist nunmal unter 10k€, 24 GB VRAM is ein muss, sonst muss ich die batchsize so runternudeln und das Training dauert ewig weilst ständig den Gradienten berechnen musst.
|
mr.nice.
endlich fertig
|
Imho irgendeine Förderung abstauben und eine DGX Station holen. Der große Sprung macht sich bei 4 GPUs bemerkbar und da können dann längere Zeit mehrere Leute davon profitieren.
|
charmin
Super Moderator
|
Imho irgendeine Förderung abstauben und eine DGX Station holen. Der große Sprung macht sich bei 4 GPUs bemerkbar und da können dann längere Zeit mehrere Leute davon profitieren. welche förderungen gibts da? und DGX, sind die nicht völlig über unserem budget von 10k ?
|
mr.nice.
endlich fertig
|
Forschungsunternehmen in Salzburg? Ich würde mich mal in der research community umhören, ob es da einen Badarf gibt, bzw. ob es nicht schon vorhandene ressourcen gibt, in die man sich vielleicht einmieten kann.
Bearbeitet von mr.nice. am 16.02.2022, 22:01
|
charmin
Super Moderator
|
Genau ja, Forschungsunternehmen in Salzburg. Naja das Ding ist halt, dass wir eigentlich jetzt was eigenes wollen und nicht mehr irgendwo einmieten. Derzeit haben wir einen Cloud dienst und der kostet dementsprechend und wennst dann ewig lang Point Clouds rüberschieben kannst, dann macht das einfach keinen Spaß. Und davon werden wir in nächster Zeit sehr sehr viel machen und davon immer wieder neue Daten. Die FH hat sich einen recht netten 30K Rechner gekauft, aber dort isses dasselbe wie auf der Uni in Salzburg. Wird nicht geteilt, da ausgelastet und auch Masterarbeiten drauf laufen. Aber nochmal, wir suchen einfach was günstigeres und endlich was eigenes: Die hier bietens ja auch an: https://lambdalabs.com/gpu-workstat...ector/customizeund da geht sich eine threadripper workstation mit 2 3090er ohne probleme mit 10k netto aus. Glaubts mas, ich hätt auch gerne nen ordentlichen cluster
|
Rogaahl
Super Moderatorinterrupt
|
Der bunte RGB Speicher is mir wurscht, das war einfach nur der billigste. Ich würde auch unbedingt ECC nehmen für sowas. Gab da einen guten post von Linus diesbezüglich. iirc hat man nach 24h eine 95% Chance auf einen bit flip bei 16GB befüllten RAM, wegen kosmische Strahlung. Ich glaube nicht das ihr solche Fehler in euren Modellen haben wollt, vor allem wenn man bedenkt das die sets oft über Jahre und Generationen weitergeführt wird.
|
charmin
Super Moderator
|
Ich würde auch unbedingt ECC nehmen für sowas. Gab da einen guten post von Linus diesbezüglich. iirc hat man nach 24h eine 95% Chance auf einen bit flip bei 16GB befüllten RAM, wegen kosmische Strahlung. Ich glaube nicht das ihr solche Fehler in euren Modellen haben wollt, vor allem wenn man bedenkt das die sets oft über Jahre und Generationen weitergeführt wird. Hab ich mir auch schon überlegt, aber was kann passieren? Die Verbindungen zwischen den Neuronen werden für eine Berechnung im Batch falsch berechnet und der Fehler wandert kurz in eine Falsche Richtung, nur damit er beim nächsten Batch wieder in die richtige wandert. Aber reine Mutmaßung und richtig auskennen tu ich mich auch nicht mit ECC RAm. kost ECC überhaupt soviel mehr?
|
Viper780
ModeratorEr ist tot, Jim!
|
Ich hab genau sowas vor 10-15 Jahren auf der Uni gemacht und ich kann nur dringend vor "custombuilds" abraten. Auch ein Händler verkauft dir da genau einen "One Time Build" den er nicht supporten kann.
Mit 10k kommst du dafür nicht aus. Nicht wenn du Support und eine stabile Maschine willst.
Egal was du berechnest oder simulierst du willst unbedingt ECC Speicher haben (RAM wie auch Grafikspeicher) du bekommst sonst einen Drift in deine Daten und komische Ausreißer die du nicht erklären kannst
|