Форум русскоязычного сообщества Ubuntu


Увидели сообщение с непонятной ссылкой, спам, непристойность или оскорбление?
Воспользуйтесь ссылкой «Сообщить модератору» рядом с сообщением!

Автор Тема: Проблема с жёстким диском, нужна помощь в поиске причины :)  (Прочитано 17818 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Alve

  • Автор темы
  • Новичок
  • *
  • Сообщений: 19
    • Просмотр профиля
Здравствуйте, уважаемое сообщество. Нужна помощь в определении причины проблемы.

Некоторое время назад был куплен новый жёсткий диск, WD 1Tb WD10EARS есть быть точным. Винт был корректно разбит (там разделы надо начинать с номера сектора, кратным 8, т.к. винт внутри имеет размер сектора не 512, а 4096 байт), поставлена система 10.04 со всеми обновлениями, кроме бекпортов и "не вошедших в официальный выпуск". И началась такая вот фигня:
(Нажмите, чтобы показать/скрыть)

Для пользователя выглядит это как подвисание системы на несколько секунд. После этого всё работает нормально. Происходит с периодичностью раз в три дня.
Чтобы было сделано:
- Поменяны шлейфы (после того как прожка wd Datalife сказала, что шлейф не годен)
- Отключены лишние IDE-контроллеры в биосе
Не помогло.

После долгого гугления на ланчпаде было найдено описание бага похоже. Я предположил, что это баг убунтовского ядра, поставил Debian Squeeze. Там ядро поновее и собрано иначе, 5 дней подобное сообщение не появлялось.

Собственно, вопрос: можно ли на основании всего этого сделать вывод, что это действительно некий баг ядра убунты? И что в таком случае делать? В дебиан перелезать сейчас желания нет. Пересобрать ядро 10.04? Собрать ванильное?

P.S. В SMART всё хорошо, никаких изменений нет и статус - исправен по всем пунктам.
« Последнее редактирование: 10 Апреля 2016, 12:37:29 от Alex_ander »

Оффлайн ArcFi

  • Старожил
  • *
  • Сообщений: 15189
    • Просмотр профиля
    • aetera.net
Re: Проблема с жёстким диском, нужна помощь в l
« Ответ #1 : 02 Октября 2010, 14:41:07 »
Винт был корректно разбит
А если данная предпосылка неверна?

Кстати, я б ещё биос апнул и глянул в настройки режимов sata (ide/ahci).
« Последнее редактирование: 02 Октября 2010, 14:42:40 от ArcFi »

Оффлайн Mam(O)n

  • Старожил
  • *
  • Сообщений: 5855
    • Просмотр профиля
Я предположил, что это баг убунтовского ядра, поставил Debian Squeeze. Там ядро поновее и собрано иначе, 5 дней подобное сообщение не появлялось.
Ну тады попробуй ядро из тестинга убунты поставить: http://kernel.ubuntu.com/~kernel-ppa/mainline/

Оффлайн arrecck

  • Старожил
  • *
  • Сообщений: 1725
    • Просмотр профиля
а если другой контроллер использовать?

Оффлайн Shefango

  • Старожил
  • *
  • Сообщений: 1120
  • "Нет ни Зла, ни Добра. Только Целесообразность"
    • Просмотр профиля
(Нажмите, чтобы показать/скрыть)
.
http://rlab.ru/doc/4k_hdd_for_linux.html
Сделай бэкап на другой хард - и только тогда. А потом ставь. У меня такой же хард.
« Последнее редактирование: 03 Октября 2010, 01:40:14 от Shefango »
Ubuntu MATE@G2120/ASRock H61M-DGS/2x2Gb RAM/500Gb,1Tb,1Tb SATA/GF GTХ650/ext4
Runtu XFCE-14.04@Dell Inspirion 3542

Оффлайн Alve

  • Автор темы
  • Новичок
  • *
  • Сообщений: 19
    • Просмотр профиля
http://rlab.ru/doc/4k_hdd_for_linux.html
Сделай бэкап на другой хард - и только тогда. А потом ставь. У меня такой же хард.

Спасибо за советы всем, пишу теперь о прогрессе решения проблемы:

Shefango, именно по этой инструкции я и делал разбивку винта. Так что проблема не в этом. Уже несколько дней работаю с ядром 2.6.35-22 из PPA, в dmesg всё хорошо, подвисаний небыло. Поэтому, склоняюсь к версии, что это как-то баг драйвера контроллера моего.
Другой контроллер использовать пробовал - когда глюк был, он был и на другом. Щас и на другом нету. Биос обновлять не пробовал, т.к. флопик подох давно, а без него моя материнка не умеет. Венду ради обновления биоса ставить лень :) А AHCI у меня материка не умеет - там SATA через эмуляцию IDE и больше ничего.

Подожду ещё несколько дней и отпишусь сюда с окончательным результатом, вдруг кому-то пригодится.

Оффлайн Alve

  • Автор темы
  • Новичок
  • *
  • Сообщений: 19
    • Просмотр профиля
Так вот. Стало понятно, что ничего не понятно.

Ошибка всё равно появляется. Совершенно никакой закономерности не выявил, может не быть 5 дней, потом - 4 раза в час.

Усиленный гуглёж намекает, что проблема в драйвере sata_nv, в котором невозможно отключить SWNCQ, собственно который и является причиной проблемы... Отключить с помощью "option swncq=0" в modprode.d/sata_nv.conf не удаётся, всё равно остаётся включенным.

Самое забавное, что под Windows XP кажется всё работает отлично... Кроме того вендовый драйвер позволяет включать-выключать разные функции и SWNCQ тоже, хотя я ещё не пробовал.

Но работать в Windows XP не вариант, хотя она у меня есть и даже лицензионная, но Linux мне нужен как RoR-разработчику, я без него обойтись не смогу в любом случае...

Вот такой прогресс :) Если какие мысли у кого появятся - буду рад любым советам.

Оффлайн sakatgg

  • Новичок
  • *
  • Сообщений: 30
    • Просмотр профиля
  У меня Минт9(Росинка) стоит на WD20EARS(MBR) в режиме ahci,юзаю наверное уже месяц,проблем таких не было.Дело похоже не в ядре
« Последнее редактирование: 17 Октября 2010, 00:44:29 от sakatgg »

Оффлайн dr.Faust

  • Активист
  • *
  • Сообщений: 435
    • Просмотр профиля
Имею похожую проблему на винте ATA WDC WD6400AADS-00M2B0 с материнкой ASUS M2N-E.
Ядро 2.6.38-13-generic.
Раньше проблем не возникало.
Какое-то время система работает нормально, потом насыпает в dmesg примерно следующее:
(Нажмите, чтобы показать/скрыть)
После чего перемонтирует диск в режим ro.
Куда копать?
« Последнее редактирование: 10 Апреля 2016, 12:37:55 от Alex_ander »

Оффлайн andrey_4j

  • Активист
  • *
  • Сообщений: 256
    • Просмотр профиля
По поводу WD10EARS и WD15EARS - у меня были и такой и такой винты (один сейчас как внешний бэкап, второй - продан). Я сперва также столкнулся с тормозной работой этих девайсов, начал гуглить, нашел все вышеописанные способы. Однако, я довольно ленив, поэтому подумал, а что предлагает разработчик, если есть какое-то решение, им и воспользуюсь, если нет, то поступлю, как умные люди предлагают. Короче говоря, нашел для этих винтов фирменную утилитку, которая "выравнивает" разделы для корректной работы с сектором 4KB. После этого проблема с тормозами ушла, и я больше о ней не вспоминал.
Tekigo wakaraba ayauki shichibai. Если знаешь язык врага, будешь в 7 раз опасней для него. (Японская пословица)

Оффлайн dj--alex

  • Старожил
  • *
  • Сообщений: 3237
  • Понимаешь, я какбы беру в руки лопату и говорю...
    • Просмотр профиля
    • все мои творения и занятия
обычныс Gparted бил 1.5tb харды
выдавали по 115mb/s скорость и без всякого геморроя с fdisk ом
ФС естественно ext4  для меня других фс вообще уже давно не существует ,
разве что вендофлешечные ФСы )))
Ubuntu 18.04 MATE x64, 19.3 x64 Mate, MX-Linux 19 Mate Mate Mate Mate. PC:B450\Ryzen3200G\16Gb\6TB\1060gtx\512Gb-Netac
https://forum.ubuntu.ru/index.php?topic=199897.0

Оффлайн es1840

  • Активист
  • *
  • Сообщений: 328
    • Просмотр профиля
Цитировать
Короче говоря, нашел для этих винтов фирменную утилитку, которая "выравнивает" разделы для корректной работы с сектором 4KB.
В linux тоже самое автоматически делает fdisk -cu device.

Оффлайн CityAceE

  • Активист
  • *
  • Сообщений: 483
  • Ubuntu 18.04 amd64
    • Просмотр профиля
    • Speccy - наш выбор!
Хочу поднять старую тему, потому как времени прошло много, а проблема такая же с той разницей, что с тех пор возрос объём жёстких дисков. Так в моей ситуации проблема возникла на 3Tb красных WD. Проблема появилась сразу после того, как я поменял старые диски на эти самые диски. И теперь с завидным постоянством в лог сыпятся ошибки:

ata1.00: failed command: WRITE FPDMA QUEUED
...
ata1.00: failed command: READ FPDMA QUEUED
...
ata2.00: failed command: WRITE FPDMA QUEUED
...
ata2.00: failed command: READ FPDMA QUEUED
Подозреваю, что проблема кроется в нестандартном размере сектора этих дисков. Но я как и автор темы изначально всё подравнивал под нужные 8 Кб.

Пока даже не знаю в какую сторону копать.
С уважением, Станислав.

Оффлайн _angus_

  • Активист
  • *
  • Сообщений: 305
  • data recovery tech
    • Просмотр профиля
А полностью что пишется в сообщениях об ошибках? Ну и самый простой вариант -- питание-то в порядке? питательные шлейфы не через удлинители, ничего не отваливается? в смарте ненормального увеличения start-stop cycles, UDMA error rate нету? что пишет smartctl -x /dev/sdX?

Оффлайн CityAceE

  • Активист
  • *
  • Сообщений: 483
  • Ubuntu 18.04 amd64
    • Просмотр профиля
    • Speccy - наш выбор!
Ошибки были в точности те же, что приводились выше в теме. После усиленного штудирования Интернета стало очевидно, что так себя ведут жёсткие диски WD с 4K секторами в связке с SATA контроллером nVidia.

В процессе поиска причины я даже обновил прошивку на жёстких дисках. Оказалось, что красные WD имею болячку, которая может привести к преждевременному их выходу из строя.

У меня всё закончилось печально. Вначале вылетел один диск из массива, собранного из двух дисков, а потом, в процессе ребилда массива, вылетел и второй. В итоге система полностью накрылась.

Но свою проблему я всё-таки решил (как мне кажется) путём покупки контроллера SATA для PCIex шины. Прошли уже почти сутки после установки этого контроллера и ошибка пока не возникала, хотя ранее она всплывала несколько раз за час.

Наверное стоило ещё поиграться с отключением SWNCQ в sata_nv, но я уже просто устал бороться с проблемой и неработающим сервером. Тут в теме выше писали, что в силу ошибок в драйвере, SWNCQ отключить было нельзя. Но вот тут написано, что уже можно, во всяком случае для моего чипсета MCP51. Возможно как-нибудь позже я всё-таки поэкспериментирую.
С уважением, Станислав.

 

Страница сгенерирована за 0.03 секунд. Запросов: 21.