"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

zwei PCs, gleiches Symptom: willkürliche Freezes

xtrm 05.02.2022 - 16:54 2321 11
Posts

xtrm

social assassin
Avatar
Registered: Jul 2002
Location:
Posts: 11908
Ich habe zwei PCs, die neuerdings an dem gleichen Symptom leiden: sie frieren willkürlich ein. Dabei kann es sein, dass beide tagelang problemlos laufen und dann auch wieder nicht. Es ist egal, ob im idle, beim Surfen, beim Videoschauen, beim Gamen, die PCs machen das einerseits problemlos mit, andererseits frieren sie einfach einmal so ein. Beide PCs sind örtlich getrennt, sprich sie befinden sich nicht am gleichen Standort.

Bei beiden PCs sind die Temperaturen generell absolut in Ordnung (also max. 80° oder darunter selbst bei synthetischen Belastungen) und alle anderen Werte wie SMART etc. ebenso. In der Windows Ereignisanzeige steht bei beiden nichts Hilfreiches, lediglich einmal "Fehler: Das System wurde zuvor am xx.‎xx.xxx um xx:xx:xx unerwartet heruntergefahren." und einmal nach dem Reboot "Kritisch: Das System wurde neu gestartet, ohne dass es zuvor ordnungsgemäß heruntergefahren wurde. Dieser Fehler kann auftreten, wenn das System nicht mehr reagiert hat oder abgestürzt ist oder die Stromzufuhr unerwartet unterbrochen wurde.".


PC1

Nun zur Vorgeschichte der jeweiligen PCs. PC1: 6600K, ASUS Z170-A, 32GB (4x8) 3000 CL15 RAM (XMP), Straight Power 10 500W. Dieser PC lief zwei Jahre lang problemlos auf einem OC von 4400 MHz im Adaptive Mode mit 1,242 VCore. Bei einer Umorganisierung des Raumes wurde der PC im Dezember 2021 komplett abgesteckt und danach wieder angesteckt. Daraufhin hieß es beim Booten, dass man F1 drücken solle, um die Setup Defaults wiederherzustellen. Gesagt getan und danach wurde im BIOS das OC-Profil wieder geladen.

Ab diesem Moment ist der PC nach ca. 20-24h Betriebszeit jedes Mal eingefroren (der PC läuft üblicherweise 24/7). Es war egal, was man gemacht oder nicht gemacht hat, nach ungefähr einem Tag Betriebszeit war es soweit. Benchmarks liefen durch, Stabilitätstests liefen durch, Gaming war auch kein Problem. Ich habe dann testweise die VCore etwas erhöht, was keinerlei Abhilfe brachte. Ich habe danach die VCore auf "Auto" gestellt - auch das half nicht.

Dann habe ich die Optimized Defaults im BIOS geladen und "Sync All Cores" aktiviert. Damit lief der PC dann ohne Freezes für mehrere Tage. Danach habe ich XMP reaktiviert und auch das lief problemlos. Zusätzlich habe ich Memtest86+ stundenlang laufen gelassen, es wurden keine Fehler gefunden. Es schien für mich so, als hätte sich die CPU nach dem Ab- und wieder Anschließen des PCs dazu entschieden, die 4400 MHz auf Dauer nicht mehr zu packen, egal mit welchen Einstellungen.

Soweit so gut, leider fing der PC kurz daraufhin wieder mit dem Problem an, jedoch meistens nicht nach 20-24h, sondern teilweise nach zehn Tagen, ein paar Tagen, manchmal aber auch einem Tag, und so weiter. Gerne friert er einfach nachts ein, wenn er im Grunde kaum etwas machen muss.

Es wurde an diesem PC in den letzten Monaten absolut NICHTS verändert. Keine neue Software die dauernd läuft, keine neuen Treiber, keine neue Hardware, keine neue Peripherie, absolut gar nichts. Das auslösende Ereignis für diese ganze Misere war anscheinend einzig und allein, dass er eine Weile vom Strom abgesteckt war als der Raum umorganisiert wurde. Ich weiß hier nicht mehr wirklich weiter und kann mir genausowenig erklären, was da los ist.


PC2

Nun zu PC2: 8700K (läuft auf stock), ASRock Z370 Extreme4, 16GB (2x8) 3600 CL14 RAM (XMP), Straight Power 11 650W. Dieser PC hatte eine Windows 10 Installation auf einer SSD, der Bootsektor war jedoch auf der verbauten HDD im System (ich weiß nicht, wer diesen PC einst eingerichtet hat, jedenfalls war es nicht ich :D). Der Besitzer hatte auf Dauer immer mehr Probleme mit dem PC, wie z.B. eine seltsame Auswahl des Bootgeräts beim Booten, einen minutenlangen schwarzen Bildschirm beim Einloggen in Windows, und so weiter.

Es wurde dann entschieden, dass wir das alles einmal ordentlich neu einrichten. Somit wurde ein aktueller Windows 10 Boot-Stick erstellt, es wurden alle relevanten Daten gesichert und dann wurde die HDD ausgebaut und in ein externes USB-Gehäuse für sporadisches Backup verfrachtet (ist nicht dauerhaft angesteckt). Die SATA-Belegung wurde leicht geändert (HDD raus, System-SSD an einen anderen SATA Slot) und das BIOS wurde resetted (das BIOS läuft noch auf einer alten Version von 2017; diese wurde auf Wunsch des Besitzers momentan beibehalten). XMP wurde aktiviert und danach wurde Windows 10 frisch installiert auf die SSD, diesmal sogar mit Bootsektor :D. Die aktuellen Treiber wurden installiert (vor allem Chipsatz und Graka [RTX 2080]), wobei LAN- und Audio-Treiber vom Windows Update installiert wurden. Alles lief gut und der PC zeigte keine der alten Probleme mehr.

Dafür fing der PC dann mit den gleichen Symptomen an wie PC1, sprich er friert beliebig ein. Egal ob beim Surfen, Videoschauen, Gaming, oder idle. Da dieser PC nicht 24/7 läuft sondern nur unter Tags wenn er genutzt wird, kann man nicht sagen, ob er immer nach X stunden einfriert oder nicht, aber manchmal kann der Besitzer den PC den ganzen Tag oder mehrere Tage hintereinander nutzen, ohne dass er einfriert, und manchmal eben nicht. Wie bei PC1 hat er grundsätzlich keine Probleme mit Belastungstests, mit Gaming, und so weiter.

Wenn der PC einfriert und danach vom Nutzer neu gestartet wird, erscheint immer die Nachricht "Es wurde kein Betriebssystem gefunden", siehe hier (BeispielScreenshot von Google: https://www.computerbase.de/forum/a...616-jpg.850794/ ). Wenn der Benutzer dann STRG+ALT+ENTF drückt bootet das System jedoch ganz normal. Dieser PC hat viel Peripherie und Software, die läuft (z.B. [für] Maus, Tastatur, Headset, Mikrofon, usw.). Aber da das ja alles vor dem Neuaufsetzen auch funktionierte, würde ich das eher ausschließen. Es wurde einmal "sfc /scannow" durchgeführt, wobei ein paar Probleme behoben wurden, die laut den Logs aber eher banale Dinge wie "ein paar Werte auf default zurücksetzen" waren. Geholfen hat es jedenfalls nichts.

Es wurden noch nicht alle Tests durchgeführt, z.B. kein Memtest86+ oder FurMark, das wird aber noch folgen. Außerdem wird heute die aktuelle System-SSD (es steht MX500 drauf, CrystalDiskInfo erkennt sie aber als eine MX100 :eek:) auf eine neue MX500 SSD zu spiegeln, um zu sehen, ob das Problem an der SSD liegt. Ein BIOS Update wird ggf. auch noch folgen, aber wenn es vor dem Neuaufsetzen damit funktioniert hat, verstehe ich nicht, warum es jetzt auf einmal nicht mehr funktionieren sollte.

Grundsätzlich weiß ich auch bei diesem PC nicht, was da los ist und wie es sein kann, dass beide PCs genau die gleichen Symptome haben. Die einzige Parallele, die ich zwischen beiden PCs sehe, ist eben, dass sie vom Strom getrennt waren eine zeitlang. Könnte das bei beiden ggf. was mit den BIOS Batterien zu tun haben? So oder so, vielleicht weiß jemand von euch ja, was es da haben könnte. tia!

WONDERMIKE

Administrator
kenough
Avatar
Registered: Jul 2001
Location: Mojo Dojo Casa H..
Posts: 10547
Ich kenne das Fehlerbild von fehlerhaften SSDs und/oder SATA Kabeln. Ist sehr schwierig zu beobachten weil es keinen klaren Auslöser durch irgendwelche Workloads oder Anwendungen gibt, dh man kann es nicht provozieren und muss gleichzeitig ständig beobachten. Gönn denen mal neue Kabeln.

Was ich trotzdem mal machen würde, auch wenns mit dem Fehlerbild jetzt nicht unbedingt in Zusammenhang stehen muss:

RAM re-seaten und die CPU nochmal einspannen. Zur Sicherheit halt eine neue CR2032 rein.

Starsky

Erbeeren für alle!
Registered: Aug 2004
Location: Proletenacker
Posts: 14296
Weil ich es nicht gelesen habe: Werkt in PC1 auch eine SSD?

Wie alt ist die SSD in PC2, neueste Firmware drauf? Geht sehr einfach mit Crucial Storage Executive.

xtrm

social assassin
Avatar
Registered: Jul 2002
Location:
Posts: 11908
@WM: Danke, werde ich machen!

@Starsky: In PC1 gibt es ausschließlich SSDs, die System-SSD ist eine Samsung EVO 850 500GB. Die MX100 im PC2 wurde soeben auf die neue MX500 gespiegelt und danach wurde die MX100 ausgebaut.
Bearbeitet von xtrm am 05.02.2022, 17:40

UnleashThebeast

Mr. Midlife-Crisis
Avatar
Registered: Dec 2005
Location: 127.0.0.1
Posts: 3457
Ich hab mich mit genau dem selben Problem bei ana Verwandtschaft herumgeärgert. Tausch die SATA-Kabel und nimm welche die ordentlich einrasten ;)

xtrm

social assassin
Avatar
Registered: Jul 2002
Location:
Posts: 11908
Ich habe jetzt PC1 komplett entstaubt und von den Laufwerken her neu verkabelt, bei einer SSD (Laufwerk D, also nicht die System-SSD) hält der Klips-Stecker nicht mehr richtig, wohl weil das Kabel konstant nach oben gebogen war und sich somit die Haken des Klips in das Plastik der SSD gebohrt und es abgescheuert haben. Habe es zur Sicherheit mit Isolierband an der Halterung angeklebt (hilft nicht viel, aber besser als garnix).

Was ich aber nach dem Booten erlebt habe, das hab ich bisher noch nicht gesehen. Die Lüfterkurven im BIOS sind komplett anders - und damit meine ich die Limits an sich. Statt minimal 20 % kann ich beim CPU-Lüfter auf einmal nur mehr 38 % wählen und bei den Gehäuselüftern statt minimal 60 % auf einmal 69 %. Zudem ist das Temp-Limit nach oben hin statt 75°C (ab da müssen alle Lüfter auf 100 % laufen im Asus BIOS :bash:) auf einmal 58°C! Sprich ab 58°C CPU Temp müssen alle Lüfter auf 100 % laufen :D. Was zum Teufel geht hier bitte vor sich?!
Bearbeitet von xtrm am 06.02.2022, 03:56

hurly

Big d00d
Registered: Aug 2002
Location: vienna
Posts: 199
ohje, das kennen wir wohl alle .. verbrenne alles und neu kaufen :))
meiner hat auch ein lustiges "problem". der PC ist aus! also echt aus. aber manchmal geh ich an ihm vorbei und er dreht sich einfach auf. keine Ahnung wie das geht. vermutlich irgendwo ein Kontaktfehler, etwas spooky aber manchmal auch praktisch :P

xtrm

social assassin
Avatar
Registered: Jul 2002
Location:
Posts: 11908
Nach einem CMOS Reset passen die Lüfterkurven etc. im BIOS wieder...aber das war wirklich seltsam. Es bleibt jedenfalls spannend :D.

Roman

CandyMan
Avatar
Registered: Jun 2000
Location: Im schönen Kär..
Posts: 3776
Was hat sich beim Raum umorganisieren getan?

Waren die PC's vorher an zwei verschiedenen Steckdosen / Steckleisten angeschlossen?
Sind sie jetzt an einer Steckdose/Steckleiste angeschlossen?
Wurde die Steckleiste ausgetauscht? Hat die Steckleiste eine Sicherung?

xtrm

social assassin
Avatar
Registered: Jul 2002
Location:
Posts: 11908
Wie anfangs erwähnt sind die beiden PCs an unterschiedlichen Orten! Sogar in unterschiedlichen Ländern :p.

Es hat sich bezüglich PC1 gar nichts geändert in dem Raum. Der PC steht an der selben Stelle (der PC musste temporär weg, weil er im Weg der Räumungsaktion war), nutzt die selben Kabel und die selben Steckerleisten. Die Leiste hat einen on/off Schalter, der aber nie auf off gestellt wird, da er ja 24/7 läuft.

xtrm

social assassin
Avatar
Registered: Jul 2002
Location:
Posts: 11908
Kurzes Update, am PC2 wurde FurMark getestet, keine Probleme. Memtest86+ wurde auch mehrere Stunden lang laufen gelassen, es gab zwei komplette Passes ohne jeglichen Fehler. Graka und RAM sollten somit in Ordnung sein.

xtrm

social assassin
Avatar
Registered: Jul 2002
Location:
Posts: 11908
Möchte kurz ein vorsichtiges Update geben:

PC#1 läuft seit knapp zwei Wochen unauffällig durch und macht alles mit, das Problem lag anscheinend an einem lockeren SATA-Kabel kombiniert mit einem Wechselrahmen, der komplett ausrangiert wurde.

PC2# läuft seit dem Wechsel der alten MX100 auf eine neue MX500 auch problemlos.

Also lag es bei beiden Geräten anscheinend an SATA-bezogenen Dingen. Richtig arg, so etwas (also dass PCs randomly deswegen crashen) ist mir in 20 Jahren PC bauen zum ersten Mal passiert, und dann gleich zweimal gleichzeitig.
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz