opsiconfd friert regelmäßig ein

tros
Beiträge: 4
Registriert: 05 Jan 2017, 09:13

opsiconfd friert regelmäßig ein

Beitrag von tros »

Hallo zusammen,

ich möchte heute über ein OPSI-Problem in unserer Umgebung berichten und um Unterstützung bitten.

Kurzform:
Der Prozess opsiconfd friert regelmäßig (ca. 5-10 Tage) ein und reagiert dann auf keine Anfragen mehr. Erst ein Neustart des Dienstes hilft bis zum nächsten Einfriern.

Systemungebung:

Ubuntu 16.04
Server mit 32 GB Ram und Intel(R) Xeon(R) CPU E3-1240 v5 @ 3.50GHz
Raid-System (auf allen Partitionen reichlich Platz)

Code: Alles auswählen

# uname -a
Linux srv-linux 4.4.0-57-generic #78-Ubuntu SMP Fri Dec 9 23:50:32 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux

Code: Alles auswählen

# dpkg --list | grep opsi
hi  opsi-atftpd                           0.7.dfsg-6                         amd64        advanced TFTP server - opsi version with pcre, fifo and max-blksize patches
hi  opsi-configed                         4.0.7.1.3-1                        all          OPSI config editor
hi  opsi-depotserver                      4.0.6.7-2                          all          opsi depotserver configuration package
hi  opsi-linux-bootimage                  20161221-1                         amd64        opsi bootimage for netboot tasks.
hi  opsi-utils                            4.0.7.7-3                          all          utilites for working with opsi.
hi  opsiconfd                             4.0.7.4.1-1                        all          opsi configuration service
hi  opsipxeconfd                          4.0.7.1-1                          all          opsi pxe configuration daemon
hi  python-opsi                           4.0.7.28-5                         all          opsi python library
Detailbeschreibung:

Meist fällt das Problem auf, weil kein Login mehr über opsi-configed möglich ist.
  • 1. Aufruf des OPSI-Webservers auf Port 4447 funktioniert nicht

    2. opsi-configed hängt im Dialog "Verbinden und authentifizieren", dann Meldung "java.net.SocketException: Software caused connection abort: recv failed"

    3. Keine Meldungen mehr in den Logs im Verzeichnis /var/log/opsi/opsi-confd/*.log

    4. Hauptprozess reagiert nicht auf SIGHUP, aber auf SIGQUIT
Ein Aufruf der Prozessliste des Servers zeigt folgendes Bild (Anzahl der Childprozesse variiert bei jedem Vorfall):
  • ein Prozess opsiconfd existiert
    ein Prozess opsiconfd-guard fehlt und ist nach einem Neustart wieder da
    opsiconfd hat 178 Childprozesse offen
    mysqld hat 40 Childprozesse offen, Datenbank ist erreichbar und manuelle Abfragen funktionieren einwandfrei
Ein strace des Hauptprozess (opsi-configd) zeigt:

Code: Alles auswählen

# strace -p 31538
strace: Process 31538 attached
futex(0x2346d90, FUTEX_WAIT_BITSET_PRIVATE|FUTEX_CLOCK_REALTIME, 0, NULL, ffffffff
Der strace des Hauptprozess verändert sich nicht.

Ein strace der Childprozesse zeigt einheitlich diese Bild, wobei die Timeoutmeldungen alle paar Sekunden auftreten:

Code: Alles auswählen

# strace -p 20449
strace: Process 20449 attached
select(0, NULL, NULL, NULL, {0, 42584}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)

# strace -p 31557
strace: Process 31557 attached
select(0, NULL, NULL, NULL, {0, 864225}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {1, 0})     = 0 (Timeout)
select(0, NULL, NULL, NULL, {1, 0})     = 0 (Timeout)
select(0, NULL, NULL, NULL, {1, 0})     = 0 (Timeout)
select(0, NULL, NULL, NULL, {1, 0})     = 0 (Timeout)
select(0, NULL, NULL, NULL, {1, 0})     = 0 (Timeout)
select(0, NULL, NULL, NULL, {1, 0})     = 0 (Timeout)

# strace -p 650
strace: Process 650 attached
select(0, NULL, NULL, NULL, {0, 45997}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
select(0, NULL, NULL, NULL, {0, 300000}) = 0 (Timeout)
Die Childprozesse scheinen noch zu leben, aber erreichen vermutlich Ihren Hauptprozess nicht.

Auszug aus opsiconfd.log (Loglevel 8) 2 Min. vor dem Absturz und nach dem Neustart:

Absturzzeit vermutlich 08:42:34 (Zeitpunkt der letzten Meldung)
Manueller Neustart des Dienstes 09:22:33

Code: Alles auswählen

[7] [Feb 06 08:40:00] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:40:01] MessageBus client stopping messageQueue <MessageQueue(Thread-627964, started 140419483969280)> (MessageBus.py|353)
[8] [Feb 06 08:40:01] MessageBus client exiting (MessageBus.py|356)
[6] [Feb 06 08:40:06] MessageBus client is starting (MessageBus.py|341)
[6] [Feb 06 08:40:06] Connecting to socket: /var/run/opsi-message-bus/opsi-message-bus.socket (MessageBus.py|337)
[7] [Feb 06 08:40:06] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:06] Transmitting messages to client 'HGGhXfemDgvTOgJ4' (MessageBus.py|224)
[6] [Feb 06 08:40:06] Initialized (MessageBus.py|400)
[6] [Feb 06 08:40:06] MessageBus client is starting (MessageBus.py|341)
[6] [Feb 06 08:40:06] Connecting to socket: /var/run/opsi-message-bus/opsi-message-bus.socket (MessageBus.py|337)
[7] [Feb 06 08:40:06] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:07] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:07] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:07] Transmitting messages to client '3HdaDUc2LYBvaBT3' (MessageBus.py|224)
[6] [Feb 06 08:40:07] Initialized (MessageBus.py|400)
[7] [Feb 06 08:40:07] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:07] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:07] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:07] Transmitting messages to client '1OHBpkKkIKvLpF5G' (MessageBus.py|224)
[7] [Feb 06 08:40:08] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:08] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:08] Transmitting messages to client 'yb1pvzSucN8waCfY' (MessageBus.py|224)
[7] [Feb 06 08:40:08] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:09] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:09] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:09] Transmitting messages to client '53GJJPvn2NOA1rCX' (MessageBus.py|224)
[6] [Feb 06 08:40:09] MessageBus client is starting (MessageBus.py|341)
[6] [Feb 06 08:40:09] Connecting to socket: /var/run/opsi-message-bus/opsi-message-bus.socket (MessageBus.py|337)
[7] [Feb 06 08:40:09] Transmitting messages to client 'hkMCCz1zPf2cMpDl' (MessageBus.py|224)
[6] [Feb 06 08:40:09] Initialized (MessageBus.py|400)
[7] [Feb 06 08:40:10] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:10] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:10] Transmitting messages to client 'pgEX4ylA3op12BNO' (MessageBus.py|224)
[7] [Feb 06 08:40:10] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:11] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:11] Transmitting messages to client 'GR2uTzOU55EkiFdw' (MessageBus.py|224)
[7] [Feb 06 08:40:11] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:11] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:11] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:11] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:11] Transmitting messages to client '93FFZzo60yWxwqLb' (MessageBus.py|224)
[7] [Feb 06 08:40:12] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:12] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:12] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:12] Transmitting messages to client 'joqYrf22bZrBolm2' (MessageBus.py|224)
[7] [Feb 06 08:40:13] Connection made (MessageBus.py|282)
[7] [Feb 06 08:40:13] Transmitting messages to client '4EyOzXJ0n603357y' (MessageBus.py|224)
[7] [Feb 06 08:40:13] Line received (MessageBus.py|290)
[6] [Feb 06 08:40:13] MessageBus client is starting (MessageBus.py|341)
[6] [Feb 06 08:40:13] Connecting to socket: /var/run/opsi-message-bus/opsi-message-bus.socket (MessageBus.py|337)
[7] [Feb 06 08:40:13] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:13] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:13] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:13] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:14] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[6] [Feb 06 08:40:14] MessageBus client is starting (MessageBus.py|341)
[6] [Feb 06 08:40:14] Connecting to socket: /var/run/opsi-message-bus/opsi-message-bus.socket (MessageBus.py|337)
[7] [Feb 06 08:40:14] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:14] Transmitting messages to client 'kZ2M1dMZoXOt0Haq' (MessageBus.py|224)
[6] [Feb 06 08:40:14] MessageBus client is starting (MessageBus.py|341)
[6] [Feb 06 08:40:14] Connecting to socket: /var/run/opsi-message-bus/opsi-message-bus.socket (MessageBus.py|337)
[7] [Feb 06 08:40:14] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:14] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:14] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:14] Transmitting messages to client '5yoTGN5f5mWXNPT2' (MessageBus.py|224)
[7] [Feb 06 08:40:14] Transmitting messages to client 'H2mcHKlUjbIktAc0' (MessageBus.py|224)
[6] [Feb 06 08:40:14] Initialized (MessageBus.py|400)
[6] [Feb 06 08:40:14] Initialized (MessageBus.py|400)
[6] [Feb 06 08:40:14] Initialized (MessageBus.py|400)
[7] [Feb 06 08:40:14] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:15] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:15] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:15] Line received (MessageBus.py|290)
[6] [Feb 06 08:40:15] MessageBus client is starting (MessageBus.py|341)
[6] [Feb 06 08:40:15] Connecting to socket: /var/run/opsi-message-bus/opsi-message-bus.socket (MessageBus.py|337)
[7] [Feb 06 08:40:15] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:15] Transmitting messages to client '0gFGxnClWBrWorJp' (MessageBus.py|224)
[6] [Feb 06 08:40:15] Initialized (MessageBus.py|400)
[7] [Feb 06 08:40:16] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[7] [Feb 06 08:40:17] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:17] Line received (MessageBus.py|290)
[8] [Feb 06 08:40:21] MessageBus client stopping messageQueue <MessageQueue(Thread-628549, started 140418936084224)> (MessageBus.py|353)
[7] [Feb 06 08:40:21] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:40:21] MessageBus client exiting (MessageBus.py|356)
[7] [Feb 06 08:40:22] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:40:23] MessageBus client stopping messageQueue <MessageQueue(Thread-628545, started 140419018733312)> (MessageBus.py|353)
[7] [Feb 06 08:40:23] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:40:23] MessageBus client exiting (MessageBus.py|356)
[6] [Feb 06 08:40:23] MessageBus client is starting (MessageBus.py|341)
[6] [Feb 06 08:40:23] Connecting to socket: /var/run/opsi-message-bus/opsi-message-bus.socket (MessageBus.py|337)
[7] [Feb 06 08:40:23] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:24] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:24] Transmitting messages to client 'cR4MH5WGoyTvAOGq' (MessageBus.py|224)
[6] [Feb 06 08:40:24] Initialized (MessageBus.py|400)
[6] [Feb 06 08:40:24] MessageBus client is starting (MessageBus.py|341)
[6] [Feb 06 08:40:24] Connecting to socket: /var/run/opsi-message-bus/opsi-message-bus.socket (MessageBus.py|337)
[7] [Feb 06 08:40:24] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:24] Client connection made (MessageBus.py|127)
[5] [Feb 06 08:40:24] MessageBusServerFactory client connection made (sJMxk5Fdc73m0ZA5), 201 client(s) connected (MessageBus.py|131)
[7] [Feb 06 08:40:24] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:24] Transmitting messages to client 'sJMxk5Fdc73m0ZA5' (MessageBus.py|224)
[6] [Feb 06 08:40:24] Initialized (MessageBus.py|400)
[8] [Feb 06 08:40:25] MessageBus client stopping messageQueue <MessageQueue(Thread-628537, started 140419052304128)> (MessageBus.py|353)
[7] [Feb 06 08:40:25] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:40:25] MessageBus client exiting (MessageBus.py|356)
[7] [Feb 06 08:40:25] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:25] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[7] [Feb 06 08:40:25] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:26] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:26] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:26] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:26] Transmitting messages to client 'YwOc3ab4swLxANSR' (MessageBus.py|224)
[7] [Feb 06 08:40:26] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:27] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:27] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[7] [Feb 06 08:40:29] Connection lost (MessageBus.py|286)
[8] [Feb 06 08:40:30] MessageBus client stopping messageQueue <MessageQueue(Thread-628560, started 140418894120704)> (MessageBus.py|353)
[7] [Feb 06 08:40:30] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:40:30] MessageBus client exiting (MessageBus.py|356)
[6] [Feb 06 08:40:31] MessageBus client is starting (MessageBus.py|341)
[6] [Feb 06 08:40:31] Connecting to socket: /var/run/opsi-message-bus/opsi-message-bus.socket (MessageBus.py|337)
[7] [Feb 06 08:40:31] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:31] Transmitting messages to client 'YKIFDsrjcQ2FvKZG' (MessageBus.py|224)
[6] [Feb 06 08:40:31] Initialized (MessageBus.py|400)
[6] [Feb 06 08:40:32] MessageBus client is starting (MessageBus.py|341)
[6] [Feb 06 08:40:32] Connecting to socket: /var/run/opsi-message-bus/opsi-message-bus.socket (MessageBus.py|337)
[7] [Feb 06 08:40:32] MessageQueue started (MessageBus.py|85)
[8] [Feb 06 08:40:32] MessageBus client stopping messageQueue <MessageQueue(Thread-628091, started 140419161409280)> (MessageBus.py|353)
[8] [Feb 06 08:40:32] MessageBus client stopping messageQueue <MessageQueue(Thread-628103, started 140419119445760)> (MessageBus.py|353)
[7] [Feb 06 08:40:32] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[7] [Feb 06 08:40:32] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:40:32] MessageBus client exiting (MessageBus.py|356)
[8] [Feb 06 08:40:32] MessageBus client exiting (MessageBus.py|356)
[7] [Feb 06 08:40:32] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:32] MessageQueue started (MessageBus.py|85)
[7] [Feb 06 08:40:32] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:32] Transmitting messages to client 'rlcWUEedzdm9uWJl' (MessageBus.py|224)
[6] [Feb 06 08:40:32] Initialized (MessageBus.py|400)
[7] [Feb 06 08:40:33] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:33] Line received (MessageBus.py|290)
[7] [Feb 06 08:40:33] Transmitting messages to client 'TedZbKF2zZAVmpaQ' (MessageBus.py|224)
[7] [Feb 06 08:40:33] Transmitting messages to client 'VVTJYYek1IJOIPOn' (MessageBus.py|224)
[7] [Feb 06 08:40:33] Line received (MessageBus.py|290)
[8] [Feb 06 08:40:34] MessageBus client stopping messageQueue <MessageQueue(Thread-628605, started 140419018733312)> (MessageBus.py|353)
[7] [Feb 06 08:40:34] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:40:34] MessageBus client exiting (MessageBus.py|356)
[7] [Feb 06 08:40:35] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[5] [Feb 06 08:41:37] Session 'zzYoZkrDLi1Z8DOwDIprIifbW4C5SEfw' from ip 'XXX.XXX.XXX.XXX', application 'opsiclientd version 4.0.87' expired after 120 seconds (Session.py|190)
[6] [Feb 06 08:41:37] Session timer <_Timer(Thread-628453, started 140419085874944)> canceled (Session.py|128)
[7] [Feb 06 08:41:37] Calling backend_exit() on backend <BackendManager()> (session.py|61)
[8] [Feb 06 08:41:37] MessageBus client stopping messageQueue <MessageQueue(Thread-628417, started 140418751444736)> (MessageBus.py|353)
[7] [Feb 06 08:41:37] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:41:37] MessageBus client stopping messageQueue <MessageQueue(Thread-628407, started 140418944476928)> (MessageBus.py|353)
[8] [Feb 06 08:41:37] MessageBus client exiting (MessageBus.py|356)
[5] [Feb 06 08:41:37] Session 'zzYoZkrDLi1Z8DOwDIprIifbW4C5SEfw' from ip 'XXX.XXX.XXX.XXX', application 'opsiclientd version 4.0.87' deleted (Session.py|225)
[7] [Feb 06 08:41:37] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:41:37] MessageBus client exiting (MessageBus.py|356)
[8] [Feb 06 08:42:25] MessageBus client stopping messageQueue <MessageQueue(Thread-628495, started 140419400042240)> (MessageBus.py|353)
[8] [Feb 06 08:42:25] MessageBus client exiting (MessageBus.py|356)
[8] [Feb 06 08:42:27] MessageBus client stopping messageQueue <MessageQueue(Thread-628472, started 140420012709632)> (MessageBus.py|353)
[7] [Feb 06 08:42:27] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:42:27] MessageBus client exiting (MessageBus.py|356)
[5] [Feb 06 08:42:33] Session 'ydY7BqDFPMg0fMT3jqhgNm9njWPimQE2' from ip 'XXX.XXX.XXX.XXX', application 'opsiclientd version 4.0.87' expired after 120 seconds (Session.py|190)
[6] [Feb 06 08:42:33] Session timer <_Timer(Thread-628663, started 140419111053056)> canceled (Session.py|128)
[7] [Feb 06 08:42:33] Calling backend_exit() on backend <BackendManager()> (session.py|61)
[7] [Feb 06 08:42:33] Calling backend_exit() on backend <BackendExtender()> (Backend.py|518)
[6] [Feb 06 08:42:33] Stopping message bus client (BackendManager.py|136)
[5] [Feb 06 08:42:34] Session 'YpYZZTpCzyTIsd6SF4c0lzIMXQn5rtIG' from ip 'XXX.XXX.XXX.XXX', application 'opsiclientd version 4.0.87' expired after 120 seconds (Session.py|190)
[6] [Feb 06 08:42:34] Session timer <_Timer(Thread-628665, started 140419693786880)> canceled (Session.py|128)
[7] [Feb 06 08:42:34] Calling backend_exit() on backend <BackendManager()> (session.py|61)
[8] [Feb 06 08:42:34] MessageBus client stopping messageQueue <MessageQueue(Thread-628611, started 140419664152320)> (MessageBus.py|353)
[7] [Feb 06 08:42:34] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[8] [Feb 06 08:42:34] MessageBus client exiting (MessageBus.py|356)
[8] [Feb 06 08:42:34] MessageBus client stopping messageQueue <MessageQueue(Thread-628637, started 140418894120704)> (MessageBus.py|353)
[7] [Feb 06 08:42:34] MessageQueue stopped (empty: True, stopped: True) (MessageBus.py|105)
[5] [Feb 06 08:42:34] Session 'YpYZZTpCzyTIsd6SF4c0lzIMXQn5rtIG' from ip 'XXX.XXX.XXX.XXX', application 'opsiclientd version 4.0.87' deleted (Session.py|225)
[8] [Feb 06 08:42:34] MessageBus client exiting (MessageBus.py|356)
[5] [Feb 06 08:42:35] Session 'ydY7BqDFPMg0fMT3jqhgNm9njWPimQE2' from ip 'XXX.XXX.XXX.XXX', application 'opsiclientd version 4.0.87' deleted (Session.py|225)
[7] [Feb 06 09:22:33] [twisted] Log opened. (Logger.py|257)
[1] [Feb 06 09:22:33]
==================================================================
=             opsi configuration service starting                =
================================================================== (Logger.py|843)
[5] [Feb 06 09:22:35] Creating pid file u'/var/run/opsiconfd/opsiconfd.pid' (opsiconfd.py|646)
[5] [Feb 06 09:22:35] Starting opsiconfd main thread (opsiconfd.py|463)
[5] [Feb 06 09:22:35] Creating unix socket '/var/run/opsi-message-bus/opsi-message-bus.socket' (MessageBus.py|251)
[4] [Feb 06 09:22:35] Unix socket '/var/run/opsi-message-bus/opsi-message-bus.socket' already exists (MessageBus.py|253)
[7] [Feb 06 09:22:35] [twisted] MessageBusServerFactory starting on '/var/run/opsi-message-bus/opsi-message-bus.socket' (Logger.py|257)
[6] [Feb 06 09:22:35] Notification server starting (MessageBus.py|259)
[6] [Feb 06 09:22:35] MessageBus client is starting (MessageBus.py|341)
[5] [Feb 06 09:22:35] Opening socket /var/run/opsiconfd/opsiconfd.socket for interprocess communication. (opsiconfd.py|432)
[7] [Feb 06 09:22:35] [twisted] OpsiProcessProtocolFactory starting on '/var/run/opsiconfd/opsiconfd.socket' (Logger.py|257)
[6] [Feb 06 09:22:35] Creating backend instance (opsiconfd.py|261)
[6] [Feb 06 09:22:35] * BackendManager is creating BackendDispatcher (BackendManager.py|264)
[6] [Feb 06 09:22:35] Backend context was set to <BackendManager()> (Backend.py|195)
[6] [Feb 06 09:22:35] Loading dispatch config file '/etc/opsi/backendManager/dispatch.conf' (BackendManager.py|371)
[7] [Feb 06 09:22:35] Trying to lock file '/etc/opsi/backendManager/dispatch.conf' (0/2000) (__init__.py|216)
[7] [Feb 06 09:22:35] File '/etc/opsi/backendManager/dispatch.conf' locked after 0 millis (__init__.py|237)
[7] [Feb 06 09:22:35] Trying to lock file '/etc/opsi/backendManager/dispatch.conf' (0/2000) (__init__.py|216)
[7] [Feb 06 09:22:35] File '/etc/opsi/backendManager/dispatch.conf' locked after 0 millis (__init__.py|237)
[7] [Feb 06 09:22:35] Read dispatch config from file u'/etc/opsi/backendManager/dispatch.conf': [[u'backend_.*', [u'mysql', u'opsipxeconfd']], [u'host_.*', [u'mysql', u'opsipxeconfd']], [u'productOnClient_.*', [u'mysql', u'opsipxeconfd']
], [u'configState_.*', [u'mysql', u'opsipxeconfd']], [u'.*', [u'mysql']]] (BackendManager.py|408)
[6] [Feb 06 09:22:35] Loading backend config '/etc/opsi/backends/opsipxeconfd.conf' (BackendManager.py|433)
[6] [Feb 06 09:22:35] Backend context was set to <BackendDispatcher(dispatchConfigFile=u'/etc/opsi/backendManager/dispatch.conf', context=<BackendManager()>)> (Backend.py|195)
[6] [Feb 06 09:22:35] Loading backend config '/etc/opsi/backends/mysql.conf' (BackendManager.py|433)
[6] [Feb 06 09:22:35] Backend context was set to <BackendDispatcher(dispatchConfigFile=u'/etc/opsi/backendManager/dispatch.conf', context=<BackendManager()>)> (Backend.py|195)
[7] [Feb 06 09:22:35] Trying to lock file '/etc/opsi/hwaudit/locales/en_US' (0/2000) (__init__.py|216)
[7] [Feb 06 09:22:35] File '/etc/opsi/hwaudit/locales/en_US' locked after 0 millis (__init__.py|237)
[7] [Feb 06 09:22:35] Found STRUCTURAL hardware class 'COMPUTER_SYSTEM' (Backend.py|1554)
[7] [Feb 06 09:22:35] Found STRUCTURAL hardware class 'CHASSIS' (Backend.py|1554)
[7] [Feb 06 09:22:35] Found STRUCTURAL hardware class 'BASE_BOARD' (Backend.py|1554)
[7] [Feb 06 09:22:35] Found STRUCTURAL hardware class 'BIOS' (Backend.py|1554)
[7] [Feb 06 09:22:35] Found STRUCTURAL hardware class 'SYSTEM_SLOT' (Backend.py|1554)
[7] [Feb 06 09:22:35] Found STRUCTURAL hardware class 'PORT_CONNECTOR' (Backend.py|1554)
Fazit:
  • Hauptprozess ist tot
    Childprozesse leben noch, melden aber alle Timeouts
    opsiconfd-guard fehlt - würde aber vermutlich eh nichts machen, da ja ein opsi-confd-Prozess existiert
    Keine Eintragungen mehr in den Logs
    Keine sichtbaren Fehlermeldungen oder Probleme vor dem Hänger - weder in den OPSI-Logs noch in den System-Logs
Ist das Problem bekannt?
Hat jemand eine Idee?

VIele Grüße

Thomas
SirTux
Beiträge: 568
Registriert: 05 Feb 2011, 18:37

Re: opsiconfd friert regelmäßig ein

Beitrag von SirTux »

Hallo,

ich konnte ähnliches bislang einmal beobachten, auch auf Ubuntu 16.04, allerdings mit Kernel 4.8. Bei dem System handelt es sich um eine Xen-VM.

Viele Grüße,
SirTux

EDIT: Gestern ist die Verbindung zum ganz Server weggebrochen während ein Client am Laden des Bootimages war. Kurz vorher war auch der opsipxeconfd nicht betriebsbereit. Vielleicht hat das auch damit zu tun.
Benutzeravatar
ueluekmen
uib-Team
Beiträge: 1939
Registriert: 28 Mai 2008, 10:53

Re: opsiconfd friert regelmäßig ein

Beitrag von ueluekmen »

Hi,

kann es sein, dass Ihr in der /etc/opsi/opsiconfd.conf die Option message bus aktiviert habt? Wenn ja, dann schaltet das mal ab.
opsi support - uib gmbh
For productive opsi installations we recommend support contracts.
http://www.uib.de
tros
Beiträge: 4
Registriert: 05 Jan 2017, 09:13

Re: opsiconfd friert regelmäßig ein

Beitrag von tros »

Hallo ueluekmen,

vielen Dank für Deinen Tip.
ueluekmen hat geschrieben:Hi,

kann es sein, dass Ihr in der /etc/opsi/opsiconfd.conf die Option message bus aktiviert habt? Wenn ja, dann schaltet das mal ab.
Gehst Du davon aus, dass das Ursache für die "Hänger" sein kann?

Kannst Du vielleicht noch ein paar Erläuterungen dazu machen damit ich den Zusammenhang richtig verstehe? (Z. B. ist der message bus buggy?)

Viele Grüße

Thomas
SirTux
Beiträge: 568
Registriert: 05 Feb 2011, 18:37

Re: opsiconfd friert regelmäßig ein

Beitrag von SirTux »

Nein ist hier nicht aktiviert.
Benutzeravatar
ueluekmen
uib-Team
Beiträge: 1939
Registriert: 28 Mai 2008, 10:53

Re: opsiconfd friert regelmäßig ein

Beitrag von ueluekmen »

@tros:
Das opsi-message-bus war eine interne Entwicklung, die wir aufgrund von instabilität eingestellt haben. Wir sind dabei diese Code stellen auch zurück zu bauen. Es war eine Idee des Longpollings. Allerdings ist das Framework, welches aktuell in opsi genutzt wird auch an dieser Stelle leider nicht Stabil genug. Leider stehen diese Optionen noch in den Conf-Files, diese fliegen bei der nächsten Version auch raus. Ich bin nur darauf gekommen, weil in deiner Log Meldungen erschienen sind, die eigentlich so im normalbetrieb nicht auftauchen sollten.

@sirtux:
Wenn du das Verhalten nur dort fest stellst, dann kann es auch ein Problem der Virtualisierung oder der Kombination sein. Wir haben hier auch Systeme (nicht opsi) die wir alle paar Tage durchtreten müssen und keiner weiß so recht warum. Da muss man im Detail nachschauen, was da im Argen liegt. Bei dir klingt das nach dem RAM-Management. Wenn die Virtualisierung da ein Problem macht, dann kann auch opsi wenig ausrichten. Ich würde in diese Richtung mal schauen, ob du was erkennst. Es sei denn du hast das Phänomen auch anderswo, als beschrieben festgestellt.
opsi support - uib gmbh
For productive opsi installations we recommend support contracts.
http://www.uib.de
tros
Beiträge: 4
Registriert: 05 Jan 2017, 09:13

Re: opsiconfd friert regelmäßig ein

Beitrag von tros »

Hallo ueluekmen,

vielen Dank. Das hilft beim Verstehen.

Ich habe die Option jetzt deaktiviert. Ich bin mir noch nicht sicher, ob das Auswirkung auf das Problemverhalten hat - aber eine deaktiviert instabile Komponenten kann nicht verkehrt sein. ;-) Wir werden es in den nächsten Tagen sehen.

VIele Grüße

Thomas
tros
Beiträge: 4
Registriert: 05 Jan 2017, 09:13

Re: opsiconfd friert regelmäßig ein

Beitrag von tros »

Hallo zusammen,
ueluekmen hat geschrieben:Hi,

kann es sein, dass Ihr in der /etc/opsi/opsiconfd.conf die Option message bus aktiviert habt? Wenn ja, dann schaltet das mal ab.
Leider hat auch die Deaktivierung des Message Bus nicht zu einer Verbeserung beigetragen. Der opsiconfd ist gestern wieder in gleicher Weise (siehe ersten Beitrag in diesem Thread) eingefroren.

Hat noch jemand eine Idee an welcher Schraube man drehen kann?

Viele Grüße

Thomas
Benutzeravatar
ueluekmen
uib-Team
Beiträge: 1939
Registriert: 28 Mai 2008, 10:53

Re: opsiconfd friert regelmäßig ein

Beitrag von ueluekmen »

Was sagt denn die Infopage? Irgendwas auffälliges zu den Einfrierzeiten? Guck mal ins htop oder top, ob du vielleicht iowaits hast, oder ob geswappt wird. Es kann aber auch einfach an einer großen Umgebung hängen. Dafür gibts professionelle Hilfe im Support und über Module 8-)
opsi support - uib gmbh
For productive opsi installations we recommend support contracts.
http://www.uib.de
SirTux
Beiträge: 568
Registriert: 05 Feb 2011, 18:37

Re: opsiconfd friert regelmäßig ein

Beitrag von SirTux »

Gestern wars wieder soweit. Eine Verbindung zum opsiconfd war nicht möglich. Beim Reboot heute kam der Server dann auch nicht mehr richtig hoch.
Antworten