"Christmas - the time to fix the computers of your loved ones" « Lord Wyrm

Dedicated Ubuntu Server nicht erreichbar

Kuhlimuh 26.02.2020 - 16:45 2576 18
Posts

Kuhlimuh

Big d00d
Registered: May 2016
Location: Wien
Posts: 139
Hallo liebe Leute,

Hab jetzt seit 2 Monaten einen Dedicated Server bei Hetzner und bin grundsätzlich sehr zufrieden, aber manchmal ist der Server nicht mehr erreichbar (ssh und darauf laufenden Services). Laut Hetzner passt alles und er hat auch keine besondere Load oder ähnliches, wenn das passiert.

Ich bin ziemlicher Anfänger was Linux betrifft und es fällt mir jetzt schwer herauszufinden, was der Grund dafür ist.

Specs:
Intel Core i7-4770
HDD2x HDD SATA 2,0 TB Enterprise
HDD1x SSD SATA 240 GB
RAM4x RAM 8192 MB DDR3
Ubuntu 18.04.3 LTS
Linux 4.15.0-88-generic
Software ist upgedatet


Also hier zu meinen Fragen:
Welche benchmark tools sollte ich verwenden um einen Hardwaredefekt auszuschließen? Habe nur CLI zur verfügung
Welche Logs wären interessant?
Gibts ein Monitoring tool, dass mir "mitschneidet", was passiert?
Bearbeitet von Kuhlimuh am 26.02.2020, 16:49

Viper780

Er ist tot, Jim!
Avatar
Registered: Mar 2001
Location: Wien
Posts: 41419
Warum nimmst nicht einen vServer? den kannst dann selbst neu starten.

davebastard

Vinyl-Sammler
Avatar
Registered: Jun 2002
Location: wean
Posts: 8575
einen rootserver bei hetzner kannst normalerweise auch im menü neustarten :p

edit: zum thema: würde versuchen das mit einem monitoring tool aufzunehmen und dann hetzner dazu befragen falls die ausfälle wirklich von ihrer seite kommen.konkrete empfehlung hab ich dazu aber keine, das was mir einfällt wäre mit kanonen auf spatzen schießen...

edit2: hardwarefehler im syslog also /var/log/syslog bzw. dmesg
Bearbeitet von davebastard am 26.02.2020, 17:15

Kuhlimuh

Big d00d
Registered: May 2016
Location: Wien
Posts: 139
Ja, den Server kann ich schon neu starten, aber das ist für einen Server der 24/7 laufen sollte, eher ungut xD .

/var/log/syslog spuckt folgendes aus beim heutigen Ausfall:
Feb 26 06:15:01 Ubuntu-1804-bionic-64-minimal CRON[28491]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 06:17:01 Ubuntu-1804-bionic-64-minimal CRON[29467]: (root) CMD ( cd / && run-parts --report /etc/cron.hourly)
^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@$
Feb 26 10:51:57 Ubuntu-1804-bionic-64-minimal systemd[1]: Mounted POSIX Message Queue File System.
Feb 26 10:51:57 Ubuntu-1804-bionic-64-minimal systemd[1]: Started Remount Root and Kernel File Systems.

Also ich weiß nicht genau, was mir das sagen soll ehrlich gesagt xD . Eventuell ein Cronjob der amok läuft?

nexus_VI

Overnumerousness!
Avatar
Registered: Aug 2006
Location: südstadt
Posts: 3070
Da ist ein relativ großer Sprung im Syslog (4 1/2 Stunden), das:
Zitat
Started Remount Root and Kernel File Systems.
Würde ich eher nach dem Boot erwarten als mitten im Betrieb.

Schau mal, dass du uns das komplette /var/log/syslog zur Verfügung stellst.

Ich hätte dir als Anfänger übrigens auch eher zu so einer Hetzner.Cloud-Instanz bzw. einem Managed Server geraten.

davebastard

Vinyl-Sammler
Avatar
Registered: Jun 2002
Location: wean
Posts: 8575
bist du sicher dass der server nicht auch rebootet ? was sagt den "uptime" ?
vielleicht fallt immer der strom aus. kaputte steckdose oder so...

ist aber reine vermutung. genaueres könnte man vielleicht mit syslog sagen.

Kuhlimuh

Big d00d
Registered: May 2016
Location: Wien
Posts: 139
Also das System hat sich heute nacht verabschiedet und nach einem hardware reset von mir wieder gestartet (das war um 10:51). Er war bestimmt von 09:00 Uhr an nicht erreichbar (aber ich geh halt aufgrund dieses log davon aus, dass er schon um 06:17 weg war).

Das Syslog zeigt seit gestern nichts interessantes (bis auf ^@^):

Code:
Feb 26 01:15:01 Ubuntu-1804-bionic-64-minimal CRON[1644]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 01:17:01 Ubuntu-1804-bionic-64-minimal CRON[2611]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Feb 26 01:25:01 Ubuntu-1804-bionic-64-minimal CRON[6719]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 01:35:01 Ubuntu-1804-bionic-64-minimal CRON[11878]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 01:45:01 Ubuntu-1804-bionic-64-minimal CRON[17086]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 01:55:01 Ubuntu-1804-bionic-64-minimal CRON[22128]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 02:00:01 Ubuntu-1804-bionic-64-minimal CRON[24610]: (root) CMD (bash /opt/pgclone/scripts/cloneclean.sh)
Feb 26 02:00:01 Ubuntu-1804-bionic-64-minimal CRON[24611]: (root) CMD (prune 1>/dev/null 2>&1)
Feb 26 02:05:01 Ubuntu-1804-bionic-64-minimal CRON[27192]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 02:12:01 Ubuntu-1804-bionic-64-minimal CRON[30752]: (root) CMD (echo radarr > /tmp/program_var && bash /opt/pgvault/pgcron)
Feb 26 02:12:01 Ubuntu-1804-bionic-64-minimal CRON[30751]: (CRON) info (No MTA installed, discarding output)
Feb 26 02:15:01 Ubuntu-1804-bionic-64-minimal CRON[32281]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 02:17:01 Ubuntu-1804-bionic-64-minimal CRON[834]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Feb 26 02:25:01 Ubuntu-1804-bionic-64-minimal CRON[5119]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 02:35:01 Ubuntu-1804-bionic-64-minimal CRON[10264]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 02:45:01 Ubuntu-1804-bionic-64-minimal CRON[15623]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 02:55:01 Ubuntu-1804-bionic-64-minimal CRON[20904]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 03:00:01 Ubuntu-1804-bionic-64-minimal CRON[23408]: (root) CMD (bash /opt/pgclone/scripts/cloneclean.sh)
Feb 26 03:00:01 Ubuntu-1804-bionic-64-minimal CRON[23407]: (root) CMD (prune 1>/dev/null 2>&1)
Feb 26 03:05:01 Ubuntu-1804-bionic-64-minimal CRON[26119]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 03:15:01 Ubuntu-1804-bionic-64-minimal CRON[31119]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 03:17:01 Ubuntu-1804-bionic-64-minimal CRON[32098]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Feb 26 03:21:01 Ubuntu-1804-bionic-64-minimal CRON[1839]: (root) CMD (echo sonarrhdr > /tmp/program_var && bash /opt/pgvault/pgcron)
Feb 26 03:21:01 Ubuntu-1804-bionic-64-minimal CRON[1838]: (CRON) info (No MTA installed, discarding output)
Feb 26 03:25:01 Ubuntu-1804-bionic-64-minimal CRON[3914]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 03:35:01 Ubuntu-1804-bionic-64-minimal CRON[9317]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 03:45:01 Ubuntu-1804-bionic-64-minimal CRON[14737]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 03:55:01 Ubuntu-1804-bionic-64-minimal CRON[19943]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 04:00:01 Ubuntu-1804-bionic-64-minimal CRON[22437]: (root) CMD (prune 1>/dev/null 2>&1)
Feb 26 04:00:01 Ubuntu-1804-bionic-64-minimal CRON[22438]: (root) CMD (bash /opt/pgclone/scripts/cloneclean.sh)
Feb 26 04:05:01 Ubuntu-1804-bionic-64-minimal CRON[25078]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 04:15:01 Ubuntu-1804-bionic-64-minimal CRON[30225]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 04:17:01 Ubuntu-1804-bionic-64-minimal CRON[31211]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Feb 26 04:25:01 Ubuntu-1804-bionic-64-minimal CRON[3355]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 04:35:01 Ubuntu-1804-bionic-64-minimal CRON[8523]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 04:45:01 Ubuntu-1804-bionic-64-minimal CRON[14009]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 04:55:01 Ubuntu-1804-bionic-64-minimal CRON[19213]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 05:00:01 Ubuntu-1804-bionic-64-minimal CRON[21795]: (root) CMD (bash /opt/pgclone/scripts/cloneclean.sh)
Feb 26 05:00:01 Ubuntu-1804-bionic-64-minimal CRON[21794]: (root) CMD (prune 1>/dev/null 2>&1)
Feb 26 05:05:01 Ubuntu-1804-bionic-64-minimal CRON[24463]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 05:15:01 Ubuntu-1804-bionic-64-minimal CRON[29553]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 05:17:01 Ubuntu-1804-bionic-64-minimal CRON[30507]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
Feb 26 05:25:01 Ubuntu-1804-bionic-64-minimal CRON[2504]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 05:34:01 Ubuntu-1804-bionic-64-minimal CRON[7143]: (root) CMD (echo sonarr > /tmp/program_var && bash /opt/pgvault/pgcron)
Feb 26 05:34:01 Ubuntu-1804-bionic-64-minimal CRON[7142]: (CRON) info (No MTA installed, discarding output)
Feb 26 05:35:01 Ubuntu-1804-bionic-64-minimal CRON[7696]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 05:45:01 Ubuntu-1804-bionic-64-minimal CRON[13080]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 05:55:01 Ubuntu-1804-bionic-64-minimal CRON[18240]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 06:00:01 Ubuntu-1804-bionic-64-minimal CRON[20778]: (root) CMD (prune 1>/dev/null 2>&1)
Feb 26 06:00:01 Ubuntu-1804-bionic-64-minimal CRON[20779]: (root) CMD (bash /opt/pgclone/scripts/cloneclean.sh)
Feb 26 06:05:01 Ubuntu-1804-bionic-64-minimal CRON[23383]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 06:15:01 Ubuntu-1804-bionic-64-minimal CRON[28491]: (root) CMD (command -v debian-sa1 > /dev/null && debian-sa1 1 1)
Feb 26 06:17:01 Ubuntu-1804-bionic-64-minimal CRON[29467]: (root) CMD (   cd / && run-parts --report /etc/cron.hourly)
^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@^@$
Feb 26 10:51:57 Ubuntu-1804-bionic-64-minimal systemd[1]: Mounted POSIX Message Queue File System.


So geht das gestern weiter.

COLOSSUS

# pkill -9 .
Avatar
Registered: Dec 2000
Location: Wien || Stmk
Posts: 10927
Zum "^@" in deinem /var/log/syslog - da stimmt irgendwas nicht. Das ist wohl der Versuch deines syslogd, entweder eine Control-Sequenz von irgendeinem tty, oder aber sonst non-printable Input zu als Text serialisieren. Hoechst ungewoehnlich auf jeden Fall! Ursache fiele mir keine ein.

Du willst einen MTA installieren, der zumindest als LDA konfiguriert ist, damit du sehen kannst, was dein crond dir mailen will ("Feb 26 05:34:01 Ubuntu-1804-bionic-64-minimal CRON[7142]: (CRON) info (No MTA installed, discarding output)") - das kann z. B. postfix sein, oder sowas wie ssmtp oder msmtp.

Falls dein Server dadurch unerreichbar wird, dass der Kernel abstuerzt, wirst du in lokalen Log-Dateien nichts finden koennen, weil Dateisysteme nicht mehr beschrieben werden, wenn es zu einem Kernel Panic gekommen ist. Dann findest du eine Zusammenfassung des Problems auf einem VT, einer seriellen Konsole, oder via netconsole als "Todesschrei" an einen Remote Host via UDP, der in der selben Broadcast Domain wie dein Host sein muss, und der dafuer konfiguriert ist. Alles schwierige unterfangen bei Hetzner und ohne iKVM. Ich wuerde einen Hetzner-Techniker bitten, einen Blick auf das lokale Display zu werfen, waehrend dein Host down ist - vor einigen Jahren zumindest hat man das dort gratis fuer Kunden gemacht.

Wenn schon nichts Spannendes im syslog landet, findest du vielleicht was im Journal deines Servers. `journalctl -n 300` oder so ist vielleicht einen Blick wert bzw. informativer.

davebastard

Vinyl-Sammler
Avatar
Registered: Jun 2002
Location: wean
Posts: 8575
ist schon 2-3 Jahre her dass wir hetzner hatten aber iirc gabs da eine virtuelle konsole oder sowas im webinterface, da könntest du was vom kernel panic sehen wenn du nicht gleich rebootest wenn er hängt.

edit: bin aber wie gesagt nicht 100% sicher aber ich glaub es war eine implementierung wo man sich mit vnc verbindet (oder mit einem java vnc client,irgendwie so)
Bearbeitet von davebastard am 26.02.2020, 23:41

nexus_VI

Overnumerousness!
Avatar
Registered: Aug 2006
Location: südstadt
Posts: 3070
Dafür muss dir ein Hetzner Techniker einen KVM Switch anhängen iirc.

Kuhlimuh

Big d00d
Registered: May 2016
Location: Wien
Posts: 139
Danke an Alle,

@COLOSSUS journalctl zeigt schon nichts mehr an, da es zu weit zurückliegt. Da passiert zuviel xD . Werde definitiv beim nächsten mal den Hetzner Support bitten, dass sie mir ein KVM anstecken. Mailserver habe ich heute auch erledigt, also hoffe ich, dass mir der was zeigst.

Es gibt eine vKVM, aber in die muss ich reinbooten (um manuell ein OS zu installieren) also denk ich nicht, dass die in dem fall was ausgibt,aber ich werds beim nächsten vorfall ansehen.

Smut

takeover & ether
Avatar
Registered: Feb 2003
Location: VIE
Posts: 15438
Disken/raid ist in ordnung?

Kuhlimuh

Big d00d
Registered: May 2016
Location: Wien
Posts: 139
Also der Server ist gerade wieder nicht erreichbar und ich habe die Techniker gebeten, dass sie mir einen KVM Switch anhängen. Bis auf das, was aktuell ausgegeben wird, was kann/sollte ich denn sonst ansehen?

@Smut: Also die Festplatten haben zwar schon einige Stunden, sind aber laut SMART noch OK.

Kuhlimuh

Big d00d
Registered: May 2016
Location: Wien
Posts: 139
Hatte jetzt Zugang zu dem KVM Switch, aber leider hat es nicht weiter geholfen. Antwort vom Suport: Ihr Server ist momentan eingeschaltet, zeigt aber weder Signal, noch reagiert er auf Tastatureingaben. Ein Neustart behebt diese Problem im Normalfall.

Najooooooo xD

davebastard

Vinyl-Sammler
Avatar
Registered: Jun 2002
Location: wean
Posts: 8575
ramcheck laufen lassen wär mein nächster vorschlag
Kontakt | Unser Forum | Über overclockers.at | Impressum | Datenschutz