У меня с недавнего времени следующая проблема:
во время бекапа системы (через tar cpzf) система падает - т.е. отваливаются все сервисы (ssh, и т.п.), диск становится read only, на команды система не реагирует - в ответ на каждую получаю Input/output error.
По dmesg увидел следующее:
Feb 28 14:25:13 loft5023 kernel: [ 14.619116] EXT4-fs (sda3): INFO: recovery required on readonly filesystem
Feb 28 14:25:13 loft5023 kernel: [ 14.619300] EXT4-fs (sda3): write access will be enabled during recovery
Feb 28 14:25:13 loft5023 kernel: [ 31.689043] EXT4-fs (sda3): orphan cleanup on readonly fs
Feb 28 14:25:13 loft5023 kernel: [ 31.689227] EXT4-fs (sda3): ext4_orphan_cleanup: deleting unreferenced inode 7602185
Feb 28 14:25:13 loft5023 kernel: [ 31.689254] EXT4-fs (sda3): ext4_orphan_cleanup: deleting unreferenced inode 7602184
Feb 28 14:25:13 loft5023 kernel: [ 31.689261] EXT4-fs (sda3): ext4_orphan_cleanup: deleting unreferenced inode 7602183
Feb 28 14:25:13 loft5023 kernel: [ 31.689268] EXT4-fs (sda3): ext4_orphan_cleanup: deleting unreferenced inode 7602182
Feb 28 14:25:13 loft5023 kernel: [ 31.689275] EXT4-fs (sda3): ext4_orphan_cleanup: deleting unreferenced inode 7602181
Feb 28 14:25:13 loft5023 kernel: [ 31.689281] EXT4-fs (sda3): 5 orphan inodes deleted
Feb 28 14:25:13 loft5023 kernel: [ 31.689455] EXT4-fs (sda3): recovery complete
Feb 28 14:25:13 loft5023 kernel: [ 32.095900] EXT4-fs (sda3): mounted filesystem with ordered data mode
Диск проверил через badblocks, вроде все ок:
hostname:~# badblocks -sv /dev/sda3 > /root/badblock_sda3
Checking blocks 0 to 463161343
Checking for bad blocks (read-only test): done
Pass completed, 0 bad blocks found.
Автоматический бекап убрал, пока все вроде работает нормально.
Правда сервер не ребутится - ни через shutdown -r now, ни через sudo init 6. Все сервисы при ребуте отваливаются, но сам сервер продолжает пинговаться.
А еще hdparm что-то непонятное выдает:
hostname:~# hdparm /dev/sda3
/dev/sda3:
HDIO_DRIVE_CMD(identify) failed: Invalid exchange
readonly = 0 (off)
readahead = 256 (on)
geometry = 60788/255/63, sectors = 926322688, start = 4999168
Подскажите, в чем может быть дело, и как это лечить.
Физического доступа к серверу нет.