Доброго времени!
Сервер на ubuntu 12.04, крутится samba 4.1.6 в качестве контроллера домена и файл-сервера.
Периодически возникают uninterruptible- процессы, пара в неделю. зависающий процесс всегда произвольный, никакой системы не вижу. например сейчас это один из модулей мониторинга munin:
$ ps -A -l
F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD
.......
4 D 65534 19677 1 0 80 0 - 0 unlink ? 00:00:00 proc_pri
1 D 65534 19678 19677 0 80 0 - 2 unlink ? 00:00:00 proc_pri
0 Z 65534 19679 19677 0 80 0 - 0 exit ? 00:00:00 grep <defunct>
1 D 65534 19680 19677 0 80 0 - 2 unlink ? 00:00:00 proc_pri
Не сталкивался с таким, не хватает опыта, чтобы понять, как диагностировать причину. Везде пишут, что в этом состоянии процесс зависает, когда ожидает ответа от какого-либо устройства ввода-вывода, но куда дальше копать не могу предположить, учитывая, что:
1. сервер виртуализован (на virtualbox, под openindiana, если это важно). но и на этом хосте параллельный linux чувствует себя нормально и на других аналогичных инсталляциях я такого не видел. правда, там не было samba. так что с вводом-выводом все должно быть ОК.
2. эти процессы фактически ничему не мешают, сервер продолжает работать штатно. лечусь перезагрузом, когда их становится штук 15, благо сервер пока тестируется на небольшой группе пользователей.
3. lsof для pid=19677 показывает:
COMMAND PID USER FD TYPE DEVICE SIZE/OFF NODE NAME
proc_pri 19677 nobody cwd DIR 8,1 4096 2 /
proc_pri 19677 nobody rtd DIR 8,1 4096 2 /
proc_pri 19677 nobody txt unknown /proc/19677/exe (readlink: No such file or directory)
proc_pri 19677 nobody 0u IPv6 852102 0t0 TCP 192.168.17.2:munin->192.168.17.1:43245 (CLOSE_WAIT)
proc_pri 19677 nobody 1w FIFO 0,8 0t0 852360 pipe
proc_pri 19677 nobody 2w FIFO 0,8 0t0 852361 pipe
proc_pri 19677 nobody 10r REG 8,1 1469 7387 /usr/share/munin/plugins/proc_pri
lsof на последующих процессах-потомках виснет, прерывается по ctrl+c
Прошу помочь с диагностикой, подскажите инструменты и вообще методику...