Opsi Server seit Update auf 4.3 ständige Timeouts

Antworten
oschwieger
Beiträge: 7
Registriert: 14 Jan 2022, 15:24

Opsi Server seit Update auf 4.3 ständige Timeouts

Beitrag von oschwieger »

Hallo,

wir haben vor mehreren Monaten unseren Opsi Server auf Version 4.3 upgedated.
Seitdem, haben wir massive Probleme mit Timeouts.
Das fängt beim Webinterface des Opsi Servers an. Dort erscheint regelmäßig die Meldung "Messagebus connection lost"
Der opsiconfd verliert ebenfalls regelmäßig die Verbindung. Teilweise muss der opsiconfd Dienst auf dem Server neu gestartet werden.
Auch der opsiclientd hat entsprechende Probleme, weshalb einige Clients keine Informationen über anstehende Installationen bekommen.
Diverse Tips aus anderen Threads haben wir schon versucht, wie redis Neuinstallation. Ausführen von opsiconfd setup etc. etc.
Im Logfile erscheint jedesmal, wenn das Webinterface die Messagebus connection verliert folgender Eintrag:

[2025-02-11 11:49:04,057] [ ] Worker(id='opsi:1' pid=1801) vanished

Hat vielleicht jemand einen Tipp an welcher Stelle wir schauen können, warum der Worker Prozess verschwindet?
Benutzeravatar
wolfbardo
uib-Team
Beiträge: 1410
Registriert: 01 Jul 2008, 12:10

Re: Opsi Server seit Update auf 4.3 ständige Timeouts

Beitrag von wolfbardo »

Wieviele Worker laufen bzw wird Scalability verwendet / wie gross ist die Umgebung?

Gruss
Bardo Wolf


Vielen Dank für die Nutzung von opsi. Im Forum ist unser Support begrenzt.

Für den professionellen Einsatz und individuelle Beratung empfehlen wir einen Support-Vertrag und eine Schulung.
Gerne informieren wir Sie zu unserem Angebot.

uib GmbH
Telefon: +49 6131 27561 0
E-Mail: sales@uib.de


oschwieger
Beiträge: 7
Registriert: 14 Jan 2022, 15:24

Re: Opsi Server seit Update auf 4.3 ständige Timeouts

Beitrag von oschwieger »

Hallo Herr Wolf,

es läuft ein Worker Prozess. Scalability haben wir nicht lizensiert.
Auf dem Server sind zur Zeit 618 Clients angelegt. Wobei da bedingt durch den Ersatz vieler PCs durch Win11 fähige, noch so einige Leichen unterwegs sind. Es sind ca. 400 Clients eingeschaltet und aktiv.

Liebe Grüße

Oliver Schwieger
oschwieger
Beiträge: 7
Registriert: 14 Jan 2022, 15:24

Re: Opsi Server seit Update auf 4.3 ständige Timeouts

Beitrag von oschwieger »

Ich hab noch was im dmesg gefunden:

[14160.851676] opsiconfd[27565]: segfault at 7fbc9022cb40 ip 00007fbc9022cb40 sp 00007fbc6a3fee98 error 14 likely on CPU 6 (core 4, socket 1)
[14160.851696] Code: Unable to access opcode bytes at 0x7fbc9022cb16.
Benutzeravatar
j.schneider
uib-Team
Beiträge: 2042
Registriert: 29 Mai 2008, 15:14

Re: Opsi Server seit Update auf 4.3 ständige Timeouts

Beitrag von j.schneider »

Hallo,

ich vermute das Problem im Betriebssystem oder in der Virtualsierungsumgebung.
Was wird hier verwendet?
Es könnte auch mit dem konfigurierten CPU-Typ zu tun haben.

Grüße
Jan Schneider


Vielen Dank für die Nutzung von opsi. Im Forum ist unser Support begrenzt.

Für den professionellen Einsatz und individuelle Beratung empfehlen wir einen Support-Vertrag und eine Schulung.
Gerne informieren wir Sie zu unserem Angebot.

uib GmbH
Telefon: +49 6131 27561 0
E-Mail: sales@uib.de


oschwieger
Beiträge: 7
Registriert: 14 Jan 2022, 15:24

Re: Opsi Server seit Update auf 4.3 ständige Timeouts

Beitrag von oschwieger »

Debian 12 unter XCP-NG. Wir haben hier auch schon verschieden Hosts ausprobiert. AMD basierte, Intel basierte, jeweils mit unterschiedlichen CPUs.
Die VM hat 16GB Ram und 1 Socket mit 4 Cores konfiguriert. Auslastung ist mit aktuell 130 aktiven Clients eher bei 0-2% und der Worker Prozess ist in den letzten 30 Minuten nicht abgestürzt. Wir haben den Opsi Server auch schon versucht komplett neu aufzusetzen, sobald wir das Backup einspielen und die Clients auf den neuen Server lassen, ist das Problem wieder da. Ein weiterere identisch aufgesetzter Server mit 40 Clients in der Datenbank läuft stabil. Das Problem besteht im Grunde seit dem Upgrade auf 4.3
Wir vermuten das eventuell ein Fehler in der Datenbank oder/und einen bestimmten Client ausgelöst wird, aber wir können da in den Logs nichts konkretes finden. Ich denke morgen früh, wenn wieder mehr PCs eingeschaltet sind, wird das Problem wieder auftauchen...
Antworten