Столкнулся к крайне неприятным явлением. После планового отключения электроэнергии (сервер был погашен штатно), при включении сервера вечером, он откликался только на пинг. Пришлось тащить к нему монитор и клаву.
Оказалось, что Ubuntu впадает в emergency mode, в котором не работает даже sshd.
Причиной впадения сервера в ужос явилась невозможность автомонтирования (через fstab) ресурса drbd, который служит для складирования бэкапов.
Закомментировал строку в fstab, сервер поднялся штатно, запустились контейнеры, и все заколосилось.
При ближайшем рассмотрении оказалось, что drbd-ресурс по непонятной причине сменил роль на secondary:
drbdadm role r0
Secondary/Secondary
а должно быть:
Primary/Secondary
Ресурс в такой роли не может быть смонтирован никак (хоть и пишут, что в ридонли якобы можно).
После пинка в афедрон
drbdadm primary r0
ресурс нормально примонтировался и стал доступен полноценно.
По данным смарт, hdd в отличном состоянии, бэдов ноль. Свободного места на разделе полно, 99% не занято.
Что это было?
Костыльно-огородные меры принял: убрал запись в fstab, монтирование теперь по крону из основного скрипта бэкапа, заодно написал всяческие проверки с попытками автоматического исправления, ну и подробное логирование. Но что это было?..
Разовый глюк, или
я не умею читать маны есть какой-то секрет в конфигурировании?
Настраивал тупо по оф. доке, простейший вариант, никаких извращений (с двумя мастерами и пр.), нагрузка на сервис drbd микроскопическая — раз в сутки синхронизировать поштучно формируемые файлы суммарно на пару сотен мегабайт.
ubuntu server 16.04
drbd 8.9.6 из штатного репо
Железо, правда, десктопное, но за полгода работы никаких претензий не было.
Общая нагрузка на железо низкая.