"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

Instabilität eingrenzen

böhmi 27.10.2021 - 11:20 3146 25
Posts

böhmi

Administrator
Spießer
Avatar
Registered: May 2004
Location: Wels Land
Posts: 4491
Ich habe jetzt schon länger auftretende Instabilitäten bei meinem PC zuhause.
Sie sind nicht reproduzierbar und auch nicht auf bestimmte Anwendungen/Belastungen einzugrenzen.

Das System macht random Reboots oder teilweise Blackscreens aus denen ich nur per PSU-Stromschalter ein/aus wieder rauskomme. Ohne Last, mit Last, im Leerlauf, ...
Teilweise rennt der PC 2-3 Stunden im Leerlauf, ohne dass ein einziges Programm geöffnet ist und wenn ich zurückkomme hat er einen reboot gemacht.
Ereignisanzeige in Windows ist diesbezüglich leer. Es gibt also keine Fehlermeldungen vor dem Reboot oder Blackscreen.
In letzter Zeit tritt das Problem gehäuft auf, manchmal aber tagelang gar nicht, auch wenn einen ganzen Vormittag mit hoher Last gearbeitet wird. Noch vor 1-2 Jahren trat das Problem höchstens 1-2x im Monat auf, aktuell teilweise an einem kurzen Abend am PC (2-3 Stunden) bis zu 2-3x.

Jetzt frage ich mich, ob ich irgendwelche Tools verwenden könnte, um das Problem einzugrenzen.
Also z.B. für erweiterte Logfiles (PSU-Spannungen oder wwi), die nach einem derartigen Absturz auch noch zu öffnen sind.

Hardwarekonfiguration hier im Link.
CPU, Mainboard, GPU, PSU usw. sind von Frühling 2017.
RAM läuft mit memtest86 ohne Probleme durch, wurde aber seit Existenz der Probleme auch schon einmal durch eine Upgrade getauscht.
Läuft unter aktuellem Windows 10 Release (die Probleme existieren aber sowieso schon seit mehreren Releases).
System wurde in der Zwischenzeit auch sicher 2x komplett neu aufgesetzt.

Leider sind die Zeiten vorbei, in denen ich jedes Stück Hardware in mehrfacher Ausführung zuhause liegen hatte und einfach testweise durchtauschen konnte. Die Lust hier einfach neue Komponenten auf gut Glück zu kaufen ist auch relativ niedrig. Wenn ich es natürlich eingrenzen kann auf z.B. "CPU oder Mainboard" wäre es nicht das große Problem.

Jemand eine Idee, wie ich den Defekt eingrenzen könnte?

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13866
cpu mal ausbauen, schauen ob die pins wirklich perfekt passen.
wärmeleitpaste tauschen. cpu wieder einbauen.
alleine der ein und ausbau hat bei mir schon so manches sys "repariert".

ram mal auf standard lassen? vl daugts dem mem controller der cpu nicht so dolle?

böhmi

Administrator
Spießer
Avatar
Registered: May 2004
Location: Wels Land
Posts: 4491
Is schon alles auf Standard, Temps sind top.
Wie gesagt auch mit unterschiedlichem RAM aufgetreten.

Hansmaulwurf

u wot m8?
Avatar
Registered: Apr 2005
Location: VBG
Posts: 5639
Furmark und GPU-Temp beobachten wäre eine Möglichkeit das mal per Sofware abzuklopfen. Hatte vor kurzem eine Maschine die jedes Mal weg war wenn die GPU auf 95° kam.
Ansonsten würde ich mal einzelne Dinge zurücktakten und schauen was passiert, also CPU 10% runter und schauen ob es weiter passiert, das es zumindest mal eingrenzbar ist.

Treiber sind alle aktuell nehm ich an?

böhmi

Administrator
Spießer
Avatar
Registered: May 2004
Location: Wels Land
Posts: 4491
Temps sind alle okay und die Reboots finden auch im Leerlauf bzw. beim Surfen und im Officebetrieb ohne Last statt.

Treiber haben sich in den Jahren seit Bestand des Problems laufend geändert (sofern aktuellere erschienen sind).

UnleashThebeast

Mr. Midlife-Crisis
Avatar
Registered: Dec 2005
Location: 127.0.0.1
Posts: 3457
Klingt für mich stark nach einem Strom/PSU-Problem.

böhmi

Administrator
Spießer
Avatar
Registered: May 2004
Location: Wels Land
Posts: 4491
Ja, das hab ich eben auch im Hinterkopf.
Aber ob's eben die PSU ist oder ein VRM-Defekt am Mainboard oder wwi, kann ich mir nicht zusammenreimen.

UnleashThebeast

Mr. Midlife-Crisis
Avatar
Registered: Dec 2005
Location: 127.0.0.1
Posts: 3457
Eher Stromversorgung hinter der PSU imho und ned vrm.

Garbage

Administrator
The Wizard of Owls
Avatar
Registered: Jul 2000
Location: GR.ch|TI.ch
Posts: 11224
Lass mal Hwinfo mitloggen und schaun bei den Systemspannungen, dann siehst hoffentlich ob es da irgendwelche groben Abweichungen oder Schwankungen gibt. Kann auch durchaus sein dass es bei Lastwechseln auftritt.

chap

small gift, big smile
Avatar
Registered: Jul 2008
Location: aut.graz
Posts: 2018
Wenn du die "Zeit hast" würde ich mal stundenlang im Abgesicherten Modus laufen lassen - dann kannst Softwareseitig den Großteil ausschließen.

Sonst wäre mein erster Verdächtiger für einen Random-Reboot immer das PSU.
Gibts im BIOS die Option "bei Power-Fail einen Reboot machen"? Diese würde ich mal deaktivieren.

xtrm

social assassin
Avatar
Registered: Jul 2002
Location:
Posts: 11907
Ist das BIOS aktuell? Hast du einmal andere RAM Slots probiert?

Ich hatte so ein ähnliches Problem auch schon einmal mit einem Ryzen 5 1600 System von einem Bekannten. Der PC hing sich entweder beim Booten auf, oder er bootete durch und lief dann eine Weile und der PC hing sich dann random auf (Bildschirm wurde schwarz). Es war egal, ob mit Last oder ohne, es ließ sich nicht reproduzieren. Ich hatte hier eh ein Topic darüber gemacht seinerzeit.

Ich hatte damals hier auch ein Topic darüber gemacht. Ich hatte alles versucht außer Teile zu tauschen - BIOS Versionen, BIOS Settings, CMOS Reset, RAM auf default laufen lassen, anderer Monitor, anderer Monitoranschluss, andere Stromsteckerleiste, anderer Stromstecker an der Wand, Belastungstests liefen alle problemlos durch...am Ende war es, aus was für einem Grund auch immer, die Grafikkarte. Daher mein Tipp: Grafikkarte! :D
Bearbeitet von xtrm am 27.10.2021, 12:33

Garbage

Administrator
The Wizard of Owls
Avatar
Registered: Jul 2000
Location: GR.ch|TI.ch
Posts: 11224
Es kann halt alles möglich sein.
Hatte bei meinem AT-PC (Ryzen 3800X) zuletzt auch Probleme, nämlich dass er nach dem Kaltstart und dem Boot in Windows oft einen reboot gemacht hat, danach aber über Stunden stabil lief.

Nachdem das PSU von 2010 ist und seither im Einsatz war, mal die Spannungen angeschaut. Ja, die 12V Leitung ist jetzt statt 12,1V früher bei mittlerweile 12,3V, aber ansonsten ist da nix ungewöhnliches gewesen. Aber gut, trotzdem mal mit einem anderen PSU (neuer und stärker) probiert -> keine Besserung.

Habe in HWinfo gesehen, dass sich recht schnell die Zahl der WHEA-Fehler gehäuft hat, bevor der reboot kam. Im Windows Log konnte man dann auch was finden, mit Verweis auf Processor Core.

Also mal versucht den Speicher von 3600 auf 3200 und 2133 runter, womit natürlich auch der FCLK reduziert wird. Mit 2133 war es zwar etwas besser, aber auch nicht weg. Andere Speichermodule probiert, einmal mit den selben Micron-E Chips, einmal mit Hynix CJR, hat auch keinen Unterschied gemacht.

Ok, dann kanns ja eigentlich nur noch CPU oder Board sein, also andere CPU (4650G) rein, probiert und siehe da, läuft alles super und fehlerfrei. Ok, also vermutlich die CPU das Problem.

Es hat mir aber dann keine Ruhe gelassen, also den 3800X in einem anderen Board/System probiert und siehe da, auch da plötzlich keine Probleme mehr. Nicht mit dem Speicher aus dem anderen System, nicht mit anderen 2 Speicherkits, alles fein mit 3200-3600 RAM. :confused:

Keine Ahnung was es da hatte und warum sich die Teile im ersten System plötzlich nicht mehr vertragen haben. Den 3800X nochmal rückbauen hab ich nicht probiert, hatte keine Lust. :p

normahl

Here to stay
Registered: Aug 2003
Location: AT
Posts: 3575
Ich hatte anfangs Probleme mit dem Energiesparplan AMD Ryzen.
Eventuell mal da einfach was anderes auswählen.

charmin

Super Moderator

Avatar
Registered: Dec 2002
Location: aut_sbg
Posts: 13866
Und schau dir mit hwinfo auch die Spannungen an!
Kann zb auch nur eine schlechte Stecker Verbindung sein.

Indigo

raub_UrhG_vergewaltiger
Avatar
Registered: Mar 2001
Location: gigritzpotschn
Posts: 6687
ich würd die rodl mal zerlegen und wieder zusammenbauen, hat schon oft bei nicht/schwer zu diagnostizierenden fehlerbildern geholfen...
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz