Форум русскоязычного сообщества Ubuntu


Следите за новостями русскоязычного сообщества Ubuntu в Twitter-ленте @ubuntu_ru_loco

Автор Тема: "BUG: soft lockup - CPU#0" произвольным процесом. Куда копать?  (Прочитано 2875 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Venom13

  • Автор темы
  • Участник
  • *
  • Сообщений: 239
    • Просмотр профиля
Добрый день.

Есть домашний сервак с Ubuntu Server 16.04. Transmision качалка, smb/nfs шара и KVM на пару тестовых машинок..
На днях скопом установил на него Java, Ippon WinPower и Munin.
(на текущий момент в обратном порядке все это удалил в поисках причины.. Munin позже вернул обратно. До установил NUT.)

Начались случайные загрузки одного ядра на 200-800% каким-либо процессом.
Нагрузка постепенно растет до полного зависания сервера.  :o
Причем 3 часа сервак работает идеально. А потом в промежутке между 3 и 6 часами случается эта напасть.

В этом состоянии перезагрузить его командами уже не удается. Только хард ресет.

В log dmesg пишет:
(Нажмите, чтобы показать/скрыть)
(номер ядра CPU и имя процесса каждый раз разное. В данном случае это процесс ping)  :idiot2:

находил похожие ситуации на англоязычных форумах - там все грешат на ядро и systemd.
Обновил сервак до 16.10. Ядро 4.8 ..
Ничего не поменялось.   :-\

Следующим шагом будет переустановить систему "с нуля".
Но хотелось бы разобраться что случилось то. Как-то это не "linux way" - переустановкой непонятный глюк лечить.  :-[

Оффлайн Alie Alexandross

  • Старожил
  • *
  • Сообщений: 1580
    • Просмотр профиля
Вот тут: kernel BUG: soft lockup - CPU stuck for 23s! заинтересовало сообщение #6, цитата:
Цитата: pqwoerituytrueiwoq
is is also possible your PSU is not giving the CPU enough power
и, парой постов ниже,
Цитировать
it is possible your motherboard is getting auto values wrong, look up the cpu on cpuworld for the specs you will need when using manual in your bios
Подпись автора jillsmitt истинна...

Оффлайн Venom13

  • Автор темы
  • Участник
  • *
  • Сообщений: 239
    • Просмотр профиля
is is also possible your PSU is not giving the CPU enough power
Странно что до этого несколько месяцев все работало исправно, и вдруг сейчас стало не хватать питания.
Ладно, по пробую на днях поменять БП. Чем черт не шутит..

А вот вторую цитату я не смог интерпретировать. Не очень с английским.  :(

Оффлайн Дмитрий Бо

  • Погонщик серверов
  • Модератор раздела
  • Старожил
  • *
  • Сообщений: 3538
  • Я не техподдержка, я за порядком слежу
    • Просмотр профиля
    • LinkedIn
Venom13, вторая: материнская плата может неправильное питание подавать, посмотри правильное значение в спеках процессора и выстави его вручную в биосе
Не опускай рук, а то пропустишь в бороду

Оффлайн Venom13

  • Автор темы
  • Участник
  • *
  • Сообщений: 239
    • Просмотр профиля
Venom13, вторая: материнская плата может неправильное питание подавать, посмотри правильное значение в спеках процессора и выстави его вручную в биосе
Спасибо!
Даже не думал что и такое может быть..  :idiot2:

Поменял блок питания - не помогло.

Вытащил видеокарту (nvidia 710) - помогло.   :o
Первая мысль была что карта сбоит.
Переставил её в комп с виндой.. 3 дня уже работает.

Видать какой-то косяк в драйвере видеокарты на сервере. :P
(вручную никаких драйверов я не устанавливал)

Оффлайн AnrDaemon

  • Заслуженный пользователь
  • Старожил
  • *
  • Сообщений: 26080
    • Просмотр профиля
Скорее, косяк в шине питания. Карта перекашивает БП и процессору нехватает напруги.
Хотите получить помощь? Потрудитесь представить запрошенную информацию в полном объёме.

Прежде чем [Отправить], нажми [Просмотр] и прочти собственное сообщение. Сам-то понял, что написал?…

 

Страница сгенерирована за 0.059 секунд. Запросов: 24.