Seite 1 von 1

Opsi Server seit Update auf 4.3 ständige Timeouts

Verfasst: 11 Feb 2025, 11:51
von oschwieger
Hallo,

wir haben vor mehreren Monaten unseren Opsi Server auf Version 4.3 upgedated.
Seitdem, haben wir massive Probleme mit Timeouts.
Das fängt beim Webinterface des Opsi Servers an. Dort erscheint regelmäßig die Meldung "Messagebus connection lost"
Der opsiconfd verliert ebenfalls regelmäßig die Verbindung. Teilweise muss der opsiconfd Dienst auf dem Server neu gestartet werden.
Auch der opsiclientd hat entsprechende Probleme, weshalb einige Clients keine Informationen über anstehende Installationen bekommen.
Diverse Tips aus anderen Threads haben wir schon versucht, wie redis Neuinstallation. Ausführen von opsiconfd setup etc. etc.
Im Logfile erscheint jedesmal, wenn das Webinterface die Messagebus connection verliert folgender Eintrag:

[2025-02-11 11:49:04,057] [ ] Worker(id='opsi:1' pid=1801) vanished

Hat vielleicht jemand einen Tipp an welcher Stelle wir schauen können, warum der Worker Prozess verschwindet?

Re: Opsi Server seit Update auf 4.3 ständige Timeouts

Verfasst: 11 Feb 2025, 13:28
von wolfbardo
Wieviele Worker laufen bzw wird Scalability verwendet / wie gross ist die Umgebung?

Gruss
Bardo Wolf

Re: Opsi Server seit Update auf 4.3 ständige Timeouts

Verfasst: 11 Feb 2025, 13:55
von oschwieger
Hallo Herr Wolf,

es läuft ein Worker Prozess. Scalability haben wir nicht lizensiert.
Auf dem Server sind zur Zeit 618 Clients angelegt. Wobei da bedingt durch den Ersatz vieler PCs durch Win11 fähige, noch so einige Leichen unterwegs sind. Es sind ca. 400 Clients eingeschaltet und aktiv.

Liebe Grüße

Oliver Schwieger

Re: Opsi Server seit Update auf 4.3 ständige Timeouts

Verfasst: 11 Feb 2025, 15:34
von oschwieger
Ich hab noch was im dmesg gefunden:

[14160.851676] opsiconfd[27565]: segfault at 7fbc9022cb40 ip 00007fbc9022cb40 sp 00007fbc6a3fee98 error 14 likely on CPU 6 (core 4, socket 1)
[14160.851696] Code: Unable to access opcode bytes at 0x7fbc9022cb16.

Re: Opsi Server seit Update auf 4.3 ständige Timeouts

Verfasst: 11 Feb 2025, 16:32
von j.schneider
Hallo,

ich vermute das Problem im Betriebssystem oder in der Virtualsierungsumgebung.
Was wird hier verwendet?
Es könnte auch mit dem konfigurierten CPU-Typ zu tun haben.

Grüße
Jan Schneider

Re: Opsi Server seit Update auf 4.3 ständige Timeouts

Verfasst: 11 Feb 2025, 17:01
von oschwieger
Debian 12 unter XCP-NG. Wir haben hier auch schon verschieden Hosts ausprobiert. AMD basierte, Intel basierte, jeweils mit unterschiedlichen CPUs.
Die VM hat 16GB Ram und 1 Socket mit 4 Cores konfiguriert. Auslastung ist mit aktuell 130 aktiven Clients eher bei 0-2% und der Worker Prozess ist in den letzten 30 Minuten nicht abgestürzt. Wir haben den Opsi Server auch schon versucht komplett neu aufzusetzen, sobald wir das Backup einspielen und die Clients auf den neuen Server lassen, ist das Problem wieder da. Ein weiterere identisch aufgesetzter Server mit 40 Clients in der Datenbank läuft stabil. Das Problem besteht im Grunde seit dem Upgrade auf 4.3
Wir vermuten das eventuell ein Fehler in der Datenbank oder/und einen bestimmten Client ausgelöst wird, aber wir können da in den Logs nichts konkretes finden. Ich denke morgen früh, wenn wieder mehr PCs eingeschaltet sind, wird das Problem wieder auftauchen...