итак, проблема была обнаружена, решена и оказалась намного интереснее чем предполагалось.
возможно кому-то это поможет.
рассказываю как всё было: зайдя в webmin на страницу с системной информацией, мой взгляд зацепился за строчку
Running processes, там фигурировало число 29380, сразу стало не по себе, периодическое нажатие F5 - показало что число процессов меняется постоянно случайным образом в диапазоне от ~11000 до ~30000. Тут-то webmin т.е. его сервак miniserv.pl и свалился...
лезу в консоль, команда топ показывает 100% занятость системы процессом fusers,
команда ps -A вывела их многотысячную армию.
гугл поделился ссылкой
http://www.flynsarmy.com/2011/11/fuser-using-100-cpu-in-ubuntu-11-10/
по которой я добрался до
https://bugs.launchpad.net/ubuntu/+source/php5/+bug/876387
собственно это оказался известный баг:
php5 cron job creates several thousand fuser zombie processes which consumes system resources and causes other applications to crash (due to lack of system resources)
фикс бага заключался в замене команды в файле /etc/cron.d/php5 на команду из версии 10.04 в которой бага нет.
This is the 11.10 cron job:
09,39 * * * * root [ -x /usr/lib/php5/maxlifetime ] && [ -d /var/lib/php5 ] && find /var/lib/php5/ -depth -mindepth 1 -maxdepth 1 -type f -cmin +$(/usr/lib/php5/maxlifetime) ! -execdir fuser -s {} 2>/dev/null \; -delete
And this is the 11.04 cron job:
09,39 * * * * root [ -x /usr/lib/php5/maxlifetime ] && [ -d /var/lib/php5 ] && find /var/lib/php5/ -depth -mindepth 1 -maxdepth 1 -type f -cmin +$(/usr/lib/php5/maxlifetime) -delete
тестирую 2 недели - всё работает. количество процессов 211.
возникает вопрос, почему система нигде не отображает что творится безобразие: что было запущенно аномальное большое количество процессов, и что процессы валятся из-за недостатка ресурсов?