Привет, ребята помогите, не могу больше.
У меня ubutnu 9.10 сервер(проблема воспроизводится так же и на 9.04, на разных железках).
Выражается обычно в том, что при активном юзании сетки и/или жесткого диска SATA подлюченного через переходник SATA->USB, а иногда и без видимых причин, машина вешается.
Причем вешается не полностью, например может отвечать на пакеты с одного интерфейса а с другого молчать.
В последнее время(под ubuntu 9.10) слетает вайловая система на корневом разделе(работает с флеш карты с встроенного кардридера).
Слетает до такой степени, что остается только форматить.
Я уже все перепробовал(кроме подключения жесткого через IDE), не могу понять в чем дело.
Все доступные показатели в норме. Температура процессора не высокая, физика дисков в порядке. На атаку не похоже, настроен iptables, в логах ничего инетресного не видно. С питанием видимых проблем не обнаружил.
Только что админил эту железку удаленно, долго админил и никаких проблем, до тех пор пока с железке по самбе не стали тянуть фильм в режиме просмотра. тут же стали сыпаться серьезные глюки(привел чуть ниже(сбои IO error происходлини независимо от устройства)). Перезагрузил железку и больше она на связь не вышла, пологаю опять фс угроблена.
Что делать, подскажите. Может это реализация USB такая? iptables как-то ядро перегружает что оно так гонит? может питания нехватет? Как убедиться? Куда копать?
root@w5277c:/mnt# /etc/init.d/squid restart
* Restarting Squid HTTP proxy squid Segmentation fault
... [fail]
root@w5277c:/mnt/data# chown -R apt-cacher-ng:apt-cacher-ng apt-cacher-ng/
chown: changing ownership of `apt-cacher-ng/uburep/pool/main/s/strigi/libstreamanalyzer0_0.7.0-1_amd64.deb.head': Input/output error
...
chown: changing ownership of `apt-cacher-ng/uburep/pool/main/libx/libxklavier/libxklavier15_4.0-0ubuntu5_amd64.deb': Input/output error
...
root@w5277c:/mnt# sudo umount data
sudo: error while loading shared libraries: libpam.so.0: cannot open shared object file: Input/output error
root@w5277c:/mnt# who
'import site' failed; use -v for traceback
Traceback (most recent call last):
File "/usr/lib/command-not-found", line 8, in <module>
import CommandNotFound
ImportError: No module named CommandNotFound
root@w5277c:/mnt# df -h
Filesystem Size Used Avail Use% Mounted on
/dev/sda1 6,4G 835M 5,3G 14% /
udev 111M 184K 110M 1% /dev
none 111M 0 111M 0% /dev/shm
none 111M 344K 110M 1% /var/run
none 111M 0 111M 0% /var/lock
none 111M 0 111M 0% /lib/init/rw
/dev/mapper/data 6,5G 3,5G 2,7G 57% /mnt/data
/dev/sdb1 459G 324G 112G 75% /opt
/dev/sdc1 8,3G 822M 7,1G 11% /mnt/tmp
root@w5277c:/# umount /mnt/data
root@w5277c:/mnt# mount
/dev/sda1 on / type ext4 (rw,sync,errors=remount-ro)
proc on /proc type proc (rw)
none on /sys type sysfs (rw,noexec,nosuid,nodev)
none on /sys/fs/fuse/connections type fusectl (rw)
none on /sys/kernel/debug type debugfs (rw)
none on /sys/kernel/security type securityfs (rw)
udev on /dev type tmpfs (rw,mode=0755)
none on /dev/pts type devpts (rw,noexec,nosuid,gid=5,mode=0620)
none on /dev/shm type tmpfs (rw,nosuid,nodev)
none on /var/run type tmpfs (rw,nosuid,mode=0755)
none on /var/lock type tmpfs (rw,noexec,nosuid,nodev)
none on /lib/init/rw type tmpfs (rw,nosuid,mode=0755)
/dev/mapper/data on /mnt/data type ext3 (rw,errors=remount-ro)
/dev/sdb1 on /opt type ext3 (rw)
/dev/sdc1 on /mnt/tmp type ext4 (rw)
Пользователь решил продолжить мысль 10 Ноября 2009, 09:24:15:
Рабочие машины работают без проблем под убунтой.
Но сервер, я действительно уже все что мог придумать опробовал, на трех разных компьютерах стояла система, минимум три разные вресии убунты, с разным питанием и на разными дисками.
Но всегда причиной переустановки были серьезные сбои(иногда редкие, иногда частые, максимум система жила 2 недели), сбои ethernet интерфейсов, сбои IO с дисками, повисания. И всегда эти сбои проявлялись при интенсивном использовании сети и дисков ссаммбой на слабеньком оборудовании.
Как вычислить из-за чего сбоит? Может кто сталкивался? Может сконфигурить что надо?