Форум русскоязычного сообщества Ubuntu


Получить помощь и пообщаться с другими пользователями Ubuntu можно
на irc канале #ubuntu-ru в сети Freenode
и в Jabber конференции ubuntu@conference.jabber.ru

Автор Тема: диагностика возникновения uninterruptible-процессов  (Прочитано 1172 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн jamest

  • Автор темы
  • Новичок
  • *
  • Сообщений: 1
    • Просмотр профиля
Доброго времени!

Сервер на ubuntu 12.04, крутится samba 4.1.6 в качестве контроллера домена и файл-сервера.
Периодически возникают uninterruptible- процессы, пара в неделю. зависающий процесс всегда произвольный, никакой системы не вижу. например сейчас это один из модулей мониторинга munin:

$ ps -A -l
F S   UID   PID  PPID  C PRI  NI ADDR SZ WCHAN  TTY          TIME CMD
.......
4 D 65534 19677     1  0  80   0 -     0 unlink ?        00:00:00 proc_pri
1 D 65534 19678 19677  0  80   0 -     2 unlink ?        00:00:00 proc_pri
0 Z 65534 19679 19677  0  80   0 -     0 exit   ?        00:00:00 grep <defunct>
1 D 65534 19680 19677  0  80   0 -     2 unlink ?        00:00:00 proc_pri

Не сталкивался с таким, не хватает опыта, чтобы понять, как диагностировать причину. Везде пишут, что в этом состоянии процесс зависает, когда ожидает ответа от какого-либо устройства ввода-вывода, но куда дальше копать не могу предположить, учитывая, что:
1. сервер виртуализован (на virtualbox, под openindiana, если это важно). но и на этом хосте параллельный linux чувствует себя нормально и на других аналогичных инсталляциях я такого не видел. правда, там не было samba. так что с вводом-выводом все должно быть ОК.
2. эти процессы фактически ничему не мешают, сервер продолжает работать штатно. лечусь перезагрузом, когда их становится штук 15, благо сервер пока тестируется на небольшой группе пользователей.
3. lsof для pid=19677 показывает:

COMMAND    PID   USER   FD      TYPE DEVICE SIZE/OFF   NODE NAME
proc_pri 19677 nobody  cwd       DIR    8,1     4096      2 /
proc_pri 19677 nobody  rtd       DIR    8,1     4096      2 /
proc_pri 19677 nobody  txt   unknown                        /proc/19677/exe (readlink: No such file or directory)
proc_pri 19677 nobody    0u     IPv6 852102      0t0    TCP 192.168.17.2:munin->192.168.17.1:43245 (CLOSE_WAIT)
proc_pri 19677 nobody    1w     FIFO    0,8      0t0 852360 pipe
proc_pri 19677 nobody    2w     FIFO    0,8      0t0 852361 pipe
proc_pri 19677 nobody   10r      REG    8,1     1469   7387 /usr/share/munin/plugins/proc_pri

lsof на последующих процессах-потомках виснет, прерывается по ctrl+c

Прошу помочь с диагностикой, подскажите инструменты и вообще методику...

 

Страница сгенерирована за 0.015 секунд. Запросов: 21.