Всем доброго времени суток. Есть сервер на котором крутится несколько сайтов на Django и несколько на php (wordpress).
Вкратце:Иногда (пока случалось дважды), ни один сайт на сервере не грузится, по ssh сервер не отвечает. После хард-ребута отпадает postgresql service. Все остальные сервисы (nginx, supervisor, redis и т.д.) включаются и все ок, а вот postgres нет.
Понять, почему зависает, а после отпадает postgres, я не могу и обращаюсь к вам за помощью!
В syslog ошибок нет, в nginx нет большой нагрузки, на ддос тоже не похоже, птмчт после ребута и включения сервисов все работает норм.
Инфа о сервере и приложениях:uname -r 4.4.0-101-generic
lsb_release -aNo LSB modules are available.
Distributor ID: Ubuntu
Description: Ubuntu 16.04.3 LTS
Release: 16.04
Codename: xenial
psql -V psql (PostgreSQL) 9.5.10
Чуть больше инфы об ошибкеПерестает отвечать сервер. Ни по ssh ни сайты не работают. Возможности зайти на сервер нет, так как сервер удаленный.
После ребута через панель управления сервер через какое-то время включается, но не стартует postgresql.
При вводе команды service postgresql status выводится что-то наподобие
postgresql.service
Loaded: error (Reason: No such file or directory)
Active: inactive (dead)
Затем, через некоторое время, он при этой же команде уже говорит, что loaded: loaded, но не стартует. нужно запустить ручками service postgresql start и тогда уже все ок.
Вот есть лог после запуска сервера (но я не могу сказать точное время, когда он включился, а когда писался этот лог, мб это после того, как я стартовал его ручками
2017-12-14 14:34:30.919 MSK [2999] СООБЩЕНИЕ: работа системы БД была прервана; последний момент работы: 2017-12-14 14:12:04 MSK
2017-12-14 14:34:31.014 MSK [3000] [н/д]@[н/д] СООБЩЕНИЕ: неполный стартовый пакет
2017-12-14 14:34:31.542 MSK [3003] postgres@postgres ВАЖНО: система баз данных запускается
2017-12-14 14:34:32.047 MSK [3006] postgres@postgres ВАЖНО: система баз данных запускается
2017-12-14 14:34:32.287 MSK [2999] СООБЩЕНИЕ: система БД была остановлена нештатно; производится автоматическое восстановление
2017-12-14 14:34:32.333 MSK [2999] СООБЩЕНИЕ: запись REDO начинается со смещения 15/95B5130
2017-12-14 14:34:32.414 MSK [2999] СООБЩЕНИЕ: неверная длина записи по смещению 15/96D2DF8
2017-12-14 14:34:32.414 MSK [2999] СООБЩЕНИЕ: записи REDO обработаны до смещения 15/96D2DD0
2017-12-14 14:34:32.414 MSK [2999] СООБЩЕНИЕ: последняя завершённая транзакция была выполнена в 2017-12-14 14:16:09.067836+03
2017-12-14 14:34:32.552 MSK [3012] postgres@postgres ВАЖНО: система баз данных запускается
2017-12-14 14:34:33.057 MSK [3015] postgres@postgres ВАЖНО: система баз данных запускается
2017-12-14 14:34:33.445 MSK [2999] СООБЩЕНИЕ: Защита от наложения мультитранзакций сейчас включена
2017-12-14 14:34:33.446 MSK [2990] СООБЩЕНИЕ: система БД готова принимать подключения
2017-12-14 14:34:33.447 MSK [3019] СООБЩЕНИЕ: процесс запуска автоочистки создан
Первый раз такая же ситуация произошла неделю назад, но все было чуть сложнее: сервер не отвечал, мы его перезагрузили, а после ребута постгрес не запускался никак совсем и при запуске падал с ошибкой no such file. Но тогда на сервере стояла ubuntu 14.04. После многочисленных попыток поднять БД (я даже делал apt-get purge postgres*, а потом заново устанавливал) проблема никак не решалась и я обновил систему до 16.04. После обновления установил постгрес и все поднялось само. И я думал, что больше такого не произойдет...
Мои вопросыКак можно узнать, почему сервер завис и ни на что не отвечал?
Какие логи смотреть, чтобы понять, в чем дело?
Доп.вопрос: почему постгрес не стартует сам? Почему он вначале не находит файла сервиса, а потом вдруг его уже загружает?
Что можно установить на сервер, чтобы было легче в будущем находить ошибки?
P.S. сильно не бейте. Если нужна какая-то инфа, скажите, я попробую ее дать. Я не особо опытный в делах серверов.
ТС не появлялся на Форуме более полугода по состоянию на 17/07/2019 (последняя явка: 14/12/2017). Модератором раздела принято решение закрыть тему.
--zg_nico