Спустя всё это время, поднимая мониторинг в другом месте, столкнулся с той же самой проблемой, и именно с la.
Выводы и решение ниже, а сейчас расскажу порядок отладки — это полезнее, чем ответ на конкретный вопрос.
Увидев, что не строится график, пошёл в конфиг и включил подробный дебаг:
#nano /etc/nagiosgrapher/ngraph.ncfg
log_level 255
Перезапускаем nagiosgrapher
#service nagiosgrapher restart
и выполняем соответствующую проверку в Nagios.
Смотрим:
#cat /var/log/nagiosgrapher/ngraph.log | grep "CPU load" -A 7 | tail
2013-01-29 09:25:01 PIPE: asterisk0 CPU load OK - load average: 0.00, 0.11, 0.18 load1=0.000;2.000;3.000;0; load5=0.110;2.000;3.000;0; load15=0.180;2.000;3.000;0; 1359411864
2013-01-29 09:25:01 REGEX: 2 blocks for 'CPU load' found.
2013-01-29 09:25:01 REGEX: graph_value=CPU
2013-01-29 09:25:01 REGEX: output=plugin.
2013-01-29 09:25:01 REGEX: regex=m/- (\d+)/i
2013-01-29 09:25:01 REGEX: perfdata=ok - load average: 0.00, 0.11, 0.18
2013-01-29 09:25:01 REGEX: NO MATCH.
2013-01-29 09:25:01 VALUES: [asterisk0][CPU load]:No matching output values found...
"2 blocks for 'CPU load' found." — проблема тут. Сервису подходит не только наше описание графика, но и ещё какое-то. Ищем его:
#cd /etc/nagiosgrapher/
#grep "CPU load" -iR *
ngraph.d/standard/check_dns.ncfg: service_name CPU load
ngraph.d/extra/check_windows.ncfg:# CPU load
ngraph.d/extra/check_windows.ncfg:# CPU load
#
Нихрена.
grep "CPU" -iR *
ngraph.d/standard/check_dns.ncfg: service_name CPU load
ngraph.d/extra/check_windows.ncfg:# CPU load
ngraph.d/extra/check_windows.ncfg: service_name NT-CPU
ngraph.d/extra/check_windows.ncfg:# CPU load
ngraph.d/extra/check_hardware.ncfg:# CPU
ngraph.d/extra/check_hardware.ncfg: service_name cpu
ngraph.d/extra/check_hardware.ncfg: graph_value CPU
ngraph.d/extra/check_hardware.ncfg: graph_legend CPU usage
ngraph.d/extra/check_hardware.ncfg: page CPU
А вот оно.
Вывод:
Оказывается, nagiosgrapher ищет не точные совпадения своих service_name и service description Nagios'а. Достаточно, чтобы service_name грепался в service description.
Идём в стоковый конфиг и сносим всё про CPU:
nano ngraph.d/extra/check_hardware.ncfg
Перезапускаем nagiosgrapher и выполняем соответствующую проверку в Nagios.
Проверяем
# cat /var/log/nagiosgrapher/ngraph.log | grep "CPU load" -A 7 | tail
2013-01-29 09:33:32 REGEX: perfdata=load1=0.000;2.000;3.000;0; load5=0.010;2.000;3.000;0; load15=0.090;2.000;3.000;0;
2013-01-29 09:33:32 REGEX: match=0.010
2013-01-29 09:33:32 VALUES: [asterisk0][CPU load]: LA5=0.010
<...>
Профит.