"We are back" « oc.at

Plötzlich zufällige Neustarts

Vinci 23.01.2026 - 07:37 2618 41
Posts

Vinci

hatin' on summer
Registered: Jan 2003
Location: Wien
Posts: 5930
Grüß euch

Ich hab seit ~2 Jahren ein neues System mit:
- Ryzen 7800X3D
- Micro-Star B650-S
- GSkill F5-6000J3038F16GX2-TZ5NR
- SSD 970 EVO 1TB

Das System lief bis gestern völlig einwandfrei, plötzlich bekomm ich aber alle ~5-15min einen zufälligen Reboot. Dachte zuerst an ein Software Problem aber das Laden eines älteren Snapshots brachte keine Besserung.

memtest lief über Nacht (vom USB Stick) einwandfrei durch.

Irgendwelche Vorschläge?
Ich lad jetzt mal irgendwas was man von USB booten kann und schau ob die Reboots dann auch auftreten...

tia

Nvidia5

Big d00d
Avatar
Registered: Apr 2007
Location: östl. Nö
Posts: 242
Könnte auch Mainboard/CPU Problem sein.
Evtl. ist auch irgendeine Steckverbindung lose geworden, entstaub mal den den PC und refitte alle Rams und ggf. Grafikkarte auch.

Wenn das nix bringt tippe ich eher auf einen Hardware Defekt am Mainboard.(z.B.: Elko)
Du könntest auch mal probieren ein Linux Live CD zu booten und schauen, ob sich das Problem dort auch reproduzieren lässt.

ENIAC

Do you Voodoo
Avatar
Registered: Sep 2003
Location: Klosterneuburg
Posts: 1893
Wie schauen die Spannungen aus?
Was hast du für ein NT.

Treten die Reboots eher bei Belastung auf oder willkürlich auch einfach am Desktop?
Hast du ein NT, dass du testhalber tauschen kannst?

Natürlich kann es sich um viele Gründe handeln - auch Mainboard oder CPU.
Wenn es sich um einen HW Defekt handelt, würde ich aber zunächst auf's NT tippen.

mr.nice.

security baseline pusher
Avatar
Registered: Jun 2004
Location: Wien
Posts: 6761
Was für Fehler sind denn im eventlog protokolliert?
Wenn es keine Festplatten oder RAM-Fehler enthält, deutet vieles auf das Netzteil.

ZARO

Here to stay
Avatar
Registered: May 2002
Location: Wien 22
Posts: 1044
Versuche mal die SOC Spannung im BIOS auf einen fixen Wert zu setzen.
RAM timings auf nicht so scharf stellen.

Vinci

hatin' on summer
Registered: Jan 2003
Location: Wien
Posts: 5930
NT ist ein Thermaltake Smart BM3 750W, zum Tauschen hab ich leider grad nix da.

Wenn der RAM betroffen ist, sollte das beim memtest nicht aufgefallen sein?

Jedimaster

Here to stay
Avatar
Registered: Dec 2005
Location: Linz
Posts: 4337
Zitat aus einem Post von mr.nice.
Was für Fehler sind denn im eventlog protokolliert?
Wenn es keine Festplatten oder RAM-Fehler enthält, deutet vieles auf das Netzteil.

+1

Sauberes Eventlog = Netzteil oder Wackelkontakt (ATX-Stecker, PCIe-Stecker auf GPU, etc...)
Fehler im Eventlog = Ram, evtl. CPU, Board oder Wackelkontakt.

@Memtest: Gibt leider Ramfehler die im Memtest nicht auffallen weil zb. die Systemzemperatur nicht so hoch ist wie im "Echtbetrieb". Prime95 würd hier mehr sagen.


Edith meint: Das Netzteil kannst auch "Stresstesten" mit Furmark, Prime95 gleichzeitg - dann sollte das System maximal Strom ziehen. Ist dann nach 1-2 Minuten "reboot", wird das Netzteil unter Last zusammenbrechen.
Bearbeitet von Jedimaster am 23.01.2026, 10:22

Vinci

hatin' on summer
Registered: Jan 2003
Location: Wien
Posts: 5930
Hm, jetzt wo der PC offen ist läuft er seit 43min ohne Probleme... seltsam ev. doch ein Hitzeproblem.
Hab auch grad prime95 ein paar mal durch den Stresstest laufen lassen.

Jedimaster

Here to stay
Avatar
Registered: Dec 2005
Location: Linz
Posts: 4337
Also wenn er aus thermischen Gründen random rebootet, muss ihm ORDENTLICH heiss werden, vorher wird der Turbo deaktiviert bzw. der Takt (deutlich) reduziert.

Kleines Gehäuse und ne starke GPU ?

Edit meint noch: Könnte auch ausgetrocknete Wärmeleitpaste sein.

Viper780

Elder
Er ist tot, Jim!
Avatar
Registered: Mar 2001
Location: Wien
Posts: 52249
Neustart bei Hitze solltest du keine mehr haben, er wird halt nur unsäglich langsam.
RAM Fehler sollten bei DDR5 rasch auffallen da sie ECC haben und damit 1-bit Fehler erkennen (aber nicht korrigieren).

zufällige Reboots klingt nach einem Problem in der Stromversorgung.
Das kann ein loser Stecker (auch in der Steckdose oder beim Verlängerungskabel!), defektes Netzteil, eine defekte SSD (oder andere Laufwerk) bis hin zu sterbenden VRM am Mainboard (oder Grafikkarte) gehen

InfiX

she/her
Avatar
Registered: Mar 2002
Location: Graz
Posts: 15057
DDR5 RAM kann auch bei hitze instabil werden

gibts einen luftzug rund ums mobo? luft oder wasserkühlung?
reboots auch im idle?
was für eine graka?

Vinci

hatin' on summer
Registered: Jan 2003
Location: Wien
Posts: 5930
Ist grad eben wieder passiert, also doch kein Hitzethema. Die Reboots passieren auch im Idle.
Steckverbinder hab ich alle überprüft, alles ok, wäre auch eher unwahrscheinlich weil der PC nie bewegt wird.
PC ist normaler Tower, hinten ein 120er raus und ein Noctua auf der CPU.

An den RAM Timings und der Spannung könnt ich noch rumfummeln... aber ich hab irgendwie meine Zweifel dass es das is. Aktuell fürcht ich das NT oder die SSD sterben grad irgendeinen langsamen Tod. Ich bespiel jetzt mal einen Stick für irgendeine Live-Gschicht und boot mal von dem weg. Mal schaun obs dann immer noch auftritt.


/edit
Das is übrigens ein Linux System. Event Log ist das Windows Ding?

journalctl meint zum letzten Reboot

Code:
Jän 23 11:57:03 threadripper systemd[1]: run-snapper\x2dtools\x2dwPbKPl.mount: Deactivated successfully.
Jän 23 11:57:04 threadripper systemd[1]: systemd-timedated.service: Deactivated successfully.
Jän 23 11:59:35 threadripper wpa_supplicant[1318]: wlp13s0: Reject scan trigger since one is already pending
-- Boot 725bc263fe3549c3ad5a7c456bf40941 --
Jän 23 12:01:46 threadripper kernel: Linux version 6.18.5-zen1-1-zen (linux-zen@archlinux) (gcc (GCC) 15.2.1 20260103, GNU ld (GNU Binutils) 2.45.1) #1 ZEN SMP PREEMPT_DYNAMIC Sun, 11 Jan 2026 17:10:37 +0000

also... nix quasi


/edit2
Kann ich die SSD irgendwie vernünftig testen?
Bearbeitet von Vinci am 23.01.2026, 13:30

Jedimaster

Here to stay
Avatar
Registered: Dec 2005
Location: Linz
Posts: 4337
einfach a paar files rumkopieren. Einen "Stresstest" gibts eher net dafür, sondern nur Dinge die halt defekte Blöcke aufdecken, was heutzutags kein echtes Thema mehr ist. SMART-Werte sind ok ?

CPU-Temperatur und ob er auf vollem Takt läuft wenn er was zu tun hat wär trotzdem noch interessant, es könnte noch sein das die Ableitung der Wärme von der CPU nimma passt (ausgetrocknete Paste, Verriegelung locker, etc... gibt da mehrere Möglichkeiten) - grad bei den Intels hatte ich es schon öfters das einfach einer der 4 Push-Pins nicht eingerastet war un der Kühler keinen gscheiten Andruck hatte. (sollts bei AMD net geben, aber ich kenn bei Gott nicht alle Kühler die es gibt)

Vinci

hatin' on summer
Registered: Jan 2003
Location: Wien
Posts: 5930
Direkt nach dem prime95 Stresstest

Code:
nct6687-isa-0a20
Adapter: ISA adapter
VIN0:               1.01 V  (min =  +0.00 V, max =  +0.00 V)
VIN1:               1.01 V  (min =  +0.00 V, max =  +0.00 V)
VIN2:               1.01 V  (min =  +0.00 V, max =  +0.00 V)
VIN3:             544.00 mV (min =  +0.00 V, max =  +0.00 V)
VIN4:               1.02 V  (min =  +0.00 V, max =  +0.00 V)
VIN5:             256.00 mV (min =  +0.00 V, max =  +0.00 V)
VIN6:             688.00 mV (min =  +0.00 V, max =  +0.00 V)
VIN7:               1.54 V  (min =  +0.00 V, max =  +0.00 V)
VCC:                3.33 V  (min =  +0.00 V, max =  +0.00 V)
fan1:             1929 RPM  (min =    0 RPM)
fan2:                0 RPM  (min =    0 RPM)
fan3:                0 RPM  (min =    0 RPM)
fan4:                0 RPM  (min =    0 RPM)
fan5:                0 RPM  (min =    0 RPM)
fan6:                0 RPM  (min =    0 RPM)
fan7:                0 RPM  (min =    0 RPM)
fan8:                0 RPM  (min =    0 RPM)
fan9:                0 RPM  (min =    0 RPM)
fan10:               0 RPM  (min =    0 RPM)
AMD TSI Addr 98h:  +76.0°C  (low  =  +0.0°C)
(high =  +0.0°C, hyst =  +0.0°C)
(crit =  +0.0°C)  sensor = AMD AMDSI
Diode 0 (curr):    +38.0°C  (low  =  +0.0°C)
(high =  +0.0°C, hyst =  +0.0°C)
(crit =  +0.0°C)  sensor = thermal diode
Thermistor 15:     +43.0°C  (low  =  +0.0°C)
(high =  +0.0°C, hyst =  +0.0°C)
(crit =  +0.0°C)  sensor = thermistor
Thermistor 1:      +43.5°C  (low  =  +0.0°C)
(high =  +0.0°C, hyst =  +0.0°C)
(crit =  +0.0°C)  sensor = thermistor
Thermistor 16:     +39.0°C  (low  =  +0.0°C)
(high =  +0.0°C, hyst =  +0.0°C)
(crit =  +0.0°C)  sensor = thermistor
Thermistor 0:      +82.5°C  (low  =  +0.0°C)
(high =  +0.0°C, hyst =  +0.0°C)
(crit =  +0.0°C)  sensor = thermistor
Thermistor 15:     +43.0°C  (low  =  +0.0°C)
(high = +126.0°C, hyst = +36.0°C)
(crit =  +0.0°C)  sensor = thermistor
pwm1:                 118%
pwm2:                 128%
pwm3:                  76%
pwm4:                  76%
pwm5:                  76%
pwm6:                  76%
pwm7:                 128%
pwm8:                  64%
intrusion0:       ALARM
beep_enable:      disabled

Jedimaster

Here to stay
Avatar
Registered: Dec 2005
Location: Linz
Posts: 4337
ok, die Zahlen sind jetzt recht schwer zu lesen, aber eins fällt ma gleich mal auf ...

Thermistor 15: +43.0°C (low = +0.0°C)
(high = +0.0°C, hyst = +0.0°C)
(crit = +0.0°C) sensor = thermistor
Thermistor 1: +43.5°C (low = +0.0°C)
(high = +0.0°C, hyst = +0.0°C)
(crit = +0.0°C) sensor = thermistor
Thermistor 16: +39.0°C (low = +0.0°C)
(high = +0.0°C, hyst = +0.0°C)
(crit = +0.0°C) sensor = thermistor
Thermistor 0: +82.5°C (low = +0.0°C)
(high = +0.0°C, hyst = +0.0°C)
(crit = +0.0°C) sensor = thermistor
Thermistor 15: +43.0°C (low = +0.0°C)
(high = +126.0°C, hyst = +36.0°C)
(crit = +0.0°C) sensor = thermistor

1x hats 82.5° was, der rest ist bei 40° ? Sind das alles CPU-Kerntemperaturen ?
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz