Vinci
hatin' on summer
|
Grüß euch
Ich hab seit ~2 Jahren ein neues System mit: - Ryzen 7800X3D - Micro-Star B650-S - GSkill F5-6000J3038F16GX2-TZ5NR - SSD 970 EVO 1TB
Das System lief bis gestern völlig einwandfrei, plötzlich bekomm ich aber alle ~5-15min einen zufälligen Reboot. Dachte zuerst an ein Software Problem aber das Laden eines älteren Snapshots brachte keine Besserung.
memtest lief über Nacht (vom USB Stick) einwandfrei durch.
Irgendwelche Vorschläge? Ich lad jetzt mal irgendwas was man von USB booten kann und schau ob die Reboots dann auch auftreten...
tia
|
Nvidia5
Big d00d
|
Könnte auch Mainboard/CPU Problem sein. Evtl. ist auch irgendeine Steckverbindung lose geworden, entstaub mal den den PC und refitte alle Rams und ggf. Grafikkarte auch.
Wenn das nix bringt tippe ich eher auf einen Hardware Defekt am Mainboard.(z.B.: Elko) Du könntest auch mal probieren ein Linux Live CD zu booten und schauen, ob sich das Problem dort auch reproduzieren lässt.
|
ENIAC
Do you Voodoo
|
Wie schauen die Spannungen aus? Was hast du für ein NT.
Treten die Reboots eher bei Belastung auf oder willkürlich auch einfach am Desktop? Hast du ein NT, dass du testhalber tauschen kannst?
Natürlich kann es sich um viele Gründe handeln - auch Mainboard oder CPU. Wenn es sich um einen HW Defekt handelt, würde ich aber zunächst auf's NT tippen.
|
mr.nice.
security baseline pusher
|
Was für Fehler sind denn im eventlog protokolliert? Wenn es keine Festplatten oder RAM-Fehler enthält, deutet vieles auf das Netzteil.
|
ZARO
Here to stay
|
Versuche mal die SOC Spannung im BIOS auf einen fixen Wert zu setzen. RAM timings auf nicht so scharf stellen.
|
Vinci
hatin' on summer
|
NT ist ein Thermaltake Smart BM3 750W, zum Tauschen hab ich leider grad nix da.
Wenn der RAM betroffen ist, sollte das beim memtest nicht aufgefallen sein?
|
Jedimaster
Here to stay
|
Was für Fehler sind denn im eventlog protokolliert? Wenn es keine Festplatten oder RAM-Fehler enthält, deutet vieles auf das Netzteil. +1 Sauberes Eventlog = Netzteil oder Wackelkontakt (ATX-Stecker, PCIe-Stecker auf GPU, etc...) Fehler im Eventlog = Ram, evtl. CPU, Board oder Wackelkontakt. @Memtest: Gibt leider Ramfehler die im Memtest nicht auffallen weil zb. die Systemzemperatur nicht so hoch ist wie im "Echtbetrieb". Prime95 würd hier mehr sagen. Edith meint: Das Netzteil kannst auch "Stresstesten" mit Furmark, Prime95 gleichzeitg - dann sollte das System maximal Strom ziehen. Ist dann nach 1-2 Minuten "reboot", wird das Netzteil unter Last zusammenbrechen.
Bearbeitet von Jedimaster am 23.01.2026, 10:22
|
Vinci
hatin' on summer
|
Hm, jetzt wo der PC offen ist läuft er seit 43min ohne Probleme... seltsam ev. doch ein Hitzeproblem. Hab auch grad prime95 ein paar mal durch den Stresstest laufen lassen.
|
Jedimaster
Here to stay
|
Also wenn er aus thermischen Gründen random rebootet, muss ihm ORDENTLICH heiss werden, vorher wird der Turbo deaktiviert bzw. der Takt (deutlich) reduziert.
Kleines Gehäuse und ne starke GPU ?
Edit meint noch: Könnte auch ausgetrocknete Wärmeleitpaste sein.
|
Viper780
ElderEr ist tot, Jim!
|
Neustart bei Hitze solltest du keine mehr haben, er wird halt nur unsäglich langsam. RAM Fehler sollten bei DDR5 rasch auffallen da sie ECC haben und damit 1-bit Fehler erkennen (aber nicht korrigieren).
zufällige Reboots klingt nach einem Problem in der Stromversorgung. Das kann ein loser Stecker (auch in der Steckdose oder beim Verlängerungskabel!), defektes Netzteil, eine defekte SSD (oder andere Laufwerk) bis hin zu sterbenden VRM am Mainboard (oder Grafikkarte) gehen
|
InfiX
she/her
|
DDR5 RAM kann auch bei hitze instabil werden
gibts einen luftzug rund ums mobo? luft oder wasserkühlung? reboots auch im idle? was für eine graka?
|
Vinci
hatin' on summer
|
Ist grad eben wieder passiert, also doch kein Hitzethema. Die Reboots passieren auch im Idle. Steckverbinder hab ich alle überprüft, alles ok, wäre auch eher unwahrscheinlich weil der PC nie bewegt wird. PC ist normaler Tower, hinten ein 120er raus und ein Noctua auf der CPU. An den RAM Timings und der Spannung könnt ich noch rumfummeln... aber ich hab irgendwie meine Zweifel dass es das is. Aktuell fürcht ich das NT oder die SSD sterben grad irgendeinen langsamen Tod. Ich bespiel jetzt mal einen Stick für irgendeine Live-Gschicht und boot mal von dem weg. Mal schaun obs dann immer noch auftritt. /edit Das is übrigens ein Linux System. Event Log ist das Windows Ding? journalctl meint zum letzten Reboot Jän 23 11:57:03 threadripper systemd[1]: run-snapper\x2dtools\x2dwPbKPl.mount: Deactivated successfully.
Jän 23 11:57:04 threadripper systemd[1]: systemd-timedated.service: Deactivated successfully.
Jän 23 11:59:35 threadripper wpa_supplicant[1318]: wlp13s0: Reject scan trigger since one is already pending
-- Boot 725bc263fe3549c3ad5a7c456bf40941 --
Jän 23 12:01:46 threadripper kernel: Linux version 6.18.5-zen1-1-zen (linux-zen@archlinux) (gcc (GCC) 15.2.1 20260103, GNU ld (GNU Binutils) 2.45.1) #1 ZEN SMP PREEMPT_DYNAMIC Sun, 11 Jan 2026 17:10:37 +0000
also... nix quasi /edit2 Kann ich die SSD irgendwie vernünftig testen?
Bearbeitet von Vinci am 23.01.2026, 13:30
|
Jedimaster
Here to stay
|
einfach a paar files rumkopieren. Einen "Stresstest" gibts eher net dafür, sondern nur Dinge die halt defekte Blöcke aufdecken, was heutzutags kein echtes Thema mehr ist. SMART-Werte sind ok ?
CPU-Temperatur und ob er auf vollem Takt läuft wenn er was zu tun hat wär trotzdem noch interessant, es könnte noch sein das die Ableitung der Wärme von der CPU nimma passt (ausgetrocknete Paste, Verriegelung locker, etc... gibt da mehrere Möglichkeiten) - grad bei den Intels hatte ich es schon öfters das einfach einer der 4 Push-Pins nicht eingerastet war un der Kühler keinen gscheiten Andruck hatte. (sollts bei AMD net geben, aber ich kenn bei Gott nicht alle Kühler die es gibt)
|
Vinci
hatin' on summer
|
Direkt nach dem prime95 Stresstest nct6687-isa-0a20
Adapter: ISA adapter
VIN0: 1.01 V (min = +0.00 V, max = +0.00 V)
VIN1: 1.01 V (min = +0.00 V, max = +0.00 V)
VIN2: 1.01 V (min = +0.00 V, max = +0.00 V)
VIN3: 544.00 mV (min = +0.00 V, max = +0.00 V)
VIN4: 1.02 V (min = +0.00 V, max = +0.00 V)
VIN5: 256.00 mV (min = +0.00 V, max = +0.00 V)
VIN6: 688.00 mV (min = +0.00 V, max = +0.00 V)
VIN7: 1.54 V (min = +0.00 V, max = +0.00 V)
VCC: 3.33 V (min = +0.00 V, max = +0.00 V)
fan1: 1929 RPM (min = 0 RPM)
fan2: 0 RPM (min = 0 RPM)
fan3: 0 RPM (min = 0 RPM)
fan4: 0 RPM (min = 0 RPM)
fan5: 0 RPM (min = 0 RPM)
fan6: 0 RPM (min = 0 RPM)
fan7: 0 RPM (min = 0 RPM)
fan8: 0 RPM (min = 0 RPM)
fan9: 0 RPM (min = 0 RPM)
fan10: 0 RPM (min = 0 RPM)
AMD TSI Addr 98h: +76.0°C (low = +0.0°C)
(high = +0.0°C, hyst = +0.0°C)
(crit = +0.0°C) sensor = AMD AMDSI
Diode 0 (curr): +38.0°C (low = +0.0°C)
(high = +0.0°C, hyst = +0.0°C)
(crit = +0.0°C) sensor = thermal diode
Thermistor 15: +43.0°C (low = +0.0°C)
(high = +0.0°C, hyst = +0.0°C)
(crit = +0.0°C) sensor = thermistor
Thermistor 1: +43.5°C (low = +0.0°C)
(high = +0.0°C, hyst = +0.0°C)
(crit = +0.0°C) sensor = thermistor
Thermistor 16: +39.0°C (low = +0.0°C)
(high = +0.0°C, hyst = +0.0°C)
(crit = +0.0°C) sensor = thermistor
Thermistor 0: +82.5°C (low = +0.0°C)
(high = +0.0°C, hyst = +0.0°C)
(crit = +0.0°C) sensor = thermistor
Thermistor 15: +43.0°C (low = +0.0°C)
(high = +126.0°C, hyst = +36.0°C)
(crit = +0.0°C) sensor = thermistor
pwm1: 118%
pwm2: 128%
pwm3: 76%
pwm4: 76%
pwm5: 76%
pwm6: 76%
pwm7: 128%
pwm8: 64%
intrusion0: ALARM
beep_enable: disabled
|
Jedimaster
Here to stay
|
ok, die Zahlen sind jetzt recht schwer zu lesen, aber eins fällt ma gleich mal auf ...
Thermistor 15: +43.0°C (low = +0.0°C) (high = +0.0°C, hyst = +0.0°C) (crit = +0.0°C) sensor = thermistor Thermistor 1: +43.5°C (low = +0.0°C) (high = +0.0°C, hyst = +0.0°C) (crit = +0.0°C) sensor = thermistor Thermistor 16: +39.0°C (low = +0.0°C) (high = +0.0°C, hyst = +0.0°C) (crit = +0.0°C) sensor = thermistor Thermistor 0: +82.5°C (low = +0.0°C) (high = +0.0°C, hyst = +0.0°C) (crit = +0.0°C) sensor = thermistor Thermistor 15: +43.0°C (low = +0.0°C) (high = +126.0°C, hyst = +36.0°C) (crit = +0.0°C) sensor = thermistor
1x hats 82.5° was, der rest ist bei 40° ? Sind das alles CPU-Kerntemperaturen ?
|