Форум русскоязычного сообщества Ubuntu


Считаете, что Ubuntu недостаточно дружелюбна к новичкам?
Помогите создать новое Руководство для новичков!

Автор Тема: WD green - видится, но не монтируется.  (Прочитано 3709 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Sabiko

  • Автор темы
  • Новичок
  • *
  • Сообщений: 15
    • Просмотр профиля
Это была тема про то, как у меня сдох первый зелёный WD. Под второй решила отдельной темы не создавать.
Новый акт марлезонского балета - двенадцатью постами ниже.
__________________

Традиционно: я маленький глупый пользователь, которому хочется чтобы "всё само работало". Приветствуются объяснения "для блондинок".

Что делалось на компе до ребута (в хронологическом порядке):
1. В синаптике был добавлен репозитарий xneur, потом установлен xneur+gxneur 0.9.7 c потребовавшимися зависимостями
2. Были установлены LAMP по этому ману.
3. Update Manager. Какие там точно были пакеты - не помню, примерно всё, что накопилось для коалы за последнюю неделю. Точно samba всякая была (ставилась довольно долго, поэтому запомнилась).

Что случилось:
Комп стал подтормаживать. Не хотел запускаться оофис. Не хотел запускаться system-monitor. При нажатии на Restart (в меню) вылезало серое окошко, на котором ничего не было. Потом вылетело сообщение об ошибке в иксах с "возможноми причинами". Не сохранила, к сожалению.  Потом вроде бы хард-ребут (или reboot в консоли? не помню).

Что было после ребута:
Отказался монтироваться корневой каталог (/ ).  Мол, в нём ошибки, запустите вручную fsck. Кроме всяких невинных фиксов он начал предлагать мне "clear inod такой-то", потому что, мол, в нём слишком много каких-то ошибок. При первом запуске я поотказывалась, но волшебной починки не произошло, пришлось запускать fsck снова и соглашаться на удаление. Поубивал он мне с дюжину этих инодов, потом вылезали ещё предложения фиксить какую-то связь между некоторыми каталогами и удалёнными инодами: в частности, довольно много упоминалась самба, один раз dpkg.
Снова рестарт - и, ура, всё примонтировалось, иксы стартанули.

Какие последствия замечены:
Не работает apt-get, не работает synaptic. Оба ругаются на поломанный dpkg. Предлагается выполнить sudo dpkg --configure -a, которое отвечает, мол: failed to open package info file `/var/lib/dpkg/status' for reading: No such file or directory
Подозреваю, именно это директория упоминалась fsck во время её разрушительной деятельности)

Вопросы:

1. Мама, что это было?! Из-за чего это случилось? Проблема железная (винту меньше полугода, терабайтник WD зелёной серии) или всё-таки софтовая?
2. Как избежать подобного впредь?
3. Как починить dpkg?

+ опционально
4. Нахрена мне самба? Беглое чтение википедии не помогло этого вкурить. Она всегда была или это на последних обновлениях её всем зачем-то подсунули? Из "сети" дома только adsl-модем, который возможно, в будущем сменится на модемо-роутеро-wi-fi-точку, по которой, скорее всего, ходить будет только нетбук под линуксом. Ещё на этом же винте есть логический диск с виндой, но она запускается в основном под игрушки, из-под неё в ext3 разделах потребности нет, да и это вроде как не сеть. Ещё Windows на виртмашине стоит. На этом сети и винды вроде бы заканчиваются.
5. Пишет ли fsck куда-нибудь лог по-умолчанию? (Да, я лох и лентяй, и мне слабо прочитать весь ман к fsck, а при беглом просмотре ничего похожего на лог не видно). Просто любопытно было бы узнать, что ещё было порушено, до того, как это что-то мне потребуется.

Заранее спасибо.

ЗЫ: если я что-то плохо описала, и для ответов на мои вопросы потребуются телепаты, то, в свою очередь, готова отвечать на любые наводящие вопросы, на которые ответить способна.
« Последнее редактирование: 16 Сентября 2010, 09:09:58 от Sabiko »

Оффлайн kochetov

  • Новичок
  • *
  • Сообщений: 10
    • Просмотр профиля
    • Барнаульский Кабан
Re: File system error -> fsck убила dpkg
« Ответ #1 : 28 Марта 2010, 22:26:41 »
Попробуйте выполнить в консоли команду
sudo grep smartd /var/log/messagesРезультат выполнения сюда.

Оффлайн jel

  • Активист
  • *
  • Сообщений: 828
    • Просмотр профиля
Re: File system error -> fsck убила dpkg
« Ответ #2 : 28 Марта 2010, 22:32:40 »
Хотелось бы также взглянуть что осталось от каталога /var/lib/dpkg/

ls /var/lib/dpkg/

Если там остался файлик status-old можно попытаться сделать

sudo cp /var/lib/dpkg/status-old /var/lib/dpkg/status

и снова попробовать

sudo dpkg --configure -a

Последние обновления скорее всего нужно будет установить заново.

Проблема, очевидно, связана с повреждением файловой системы, а вот железная она или софтовая покажет вдумчивое чтение логов.

Оффлайн Sabiko

  • Автор темы
  • Новичок
  • *
  • Сообщений: 15
    • Просмотр профиля
Re: File system error -> fsck убила dpkg
« Ответ #3 : 28 Марта 2010, 22:50:39 »
Попробуйте выполнить в консоли команду
sudo grep smartd /var/log/messages

По нулям. Судя по всему, у меня не стоят smartmontools.

Хотелось бы также взглянуть что осталось от каталога /var/lib/dpkg/

ls /var/lib/dpkg/

Если там остался файлик status-old можно попытаться
Нет, не осталось. В корне там:
alternatives  available-old  cmethopt  diversions  diversions-old  info  lock  parts  statoverride  statoverride-old  triggers  updates  tmp.ci
« Последнее редактирование: 01 Апреля 2010, 13:53:14 от Sabiko »

Оффлайн jel

  • Активист
  • *
  • Сообщений: 828
    • Просмотр профиля
Re: File system error -> fsck убила dpkg
« Ответ #4 : 28 Марта 2010, 22:58:49 »
Тогда можно поискать /var/backups/dpkg.status.0

Это ежедневный бэкап столь необходимого нам файлика.

sudo cp /var/backups/dpkg.status.0 /var/lib/dpkg/status

и снова попробовать

sudo dpkg --configure -a

Оффлайн Sabiko

  • Автор темы
  • Новичок
  • *
  • Сообщений: 15
    • Просмотр профиля
Re: File system error -> fsck убила dpkg
« Ответ #5 : 28 Марта 2010, 23:13:19 »
Из бекапа восстановила, теперь следующая ошибка:
dpkg: parse error, in file '/var/lib/dpkg/updates/0001' near line 2:
 missing package name

Содержимое файлов там примерно такое (цитирую начало и конец):
0001:
age: python-metacity
Auto-Installed: 1

Package: libpoppler5
Auto-Installed: 1

[...]

Package: gnome-sud

0002:
ed: 1

Package: liblastfm0
Auto-Installed: 1

[...]

Package: libgdata-

И т.д. Удалить их всех нафиг или они нужны?

upd. Забэкапила, снесла.
Вылезло failed to open package info file `/var/lib/dpkg/available' for reading: No such file or directory
Сделала sudo cp /var/lib/dpkg/available-old /var/lib/dpkg/available

Теперь  syntax error in triggers deferred file `/var/lib/dpkg/triggers/Unincorp' at character `�' midline
Чёрт, по-моему это будет продолжаться вечно 0_о
« Последнее редактирование: 28 Марта 2010, 23:31:51 от Sabiko »

Оффлайн jel

  • Активист
  • *
  • Сообщений: 828
    • Просмотр профиля
Re: File system error -> fsck убила dpkg
« Ответ #6 : 28 Марта 2010, 23:30:10 »
У меня в /var/lib/dpkg/updates/ пусто. Перенеси их куда-нибудь на всякий случай и попробуй снова.

Пользователь решил продолжить мысль 28 Марта 2010, 23:35:21:
/var/lib/dpkg/triggers/Unincorp у меня пустой. Размер - 0.

sudo rm /var/lib/dpkg/triggers/Unincorp
sudo touch /var/lib/dpkg/triggers/Unincorp

Видно крепко досталось файловой системе.
« Последнее редактирование: 28 Марта 2010, 23:35:21 от jel »

Оффлайн Sabiko

  • Автор темы
  • Новичок
  • *
  • Сообщений: 15
    • Просмотр профиля
Re: File system error -> fsck убила dpkg
« Ответ #7 : 29 Марта 2010, 20:28:50 »
Так. С пунктом три разобрались, но пункты один и два по прежнему тревожат меня!

Последние обновления скорее всего нужно будет установить заново.

Даже не знаю, что тут делать. Действительно, часть устанавливашихся вчера пакетов в синаптике отмечена звёздочкой и жаждет обновиться, часть вообще отмечена как неустановленные. При этом всё на месте, стоит, последние версии. Бэкапить конфигурационные файлы и реинсталлить? Или можно как-то объяснить синаптику, что он неправ?
Кстати, при попытке поставить что-либо, он рвётся заодно деинсталлировать некие bsd-mailx и mailx Откуда они взялись, либо почему ему стали неугодны - неясно.

Проблема, очевидно, связана с повреждением файловой системы, а вот железная она или софтовая покажет вдумчивое чтение логов.

После воскрешения dpkg поставила я в итоге smartmontools.
Кусок из того, что выдаёт sudo smartctl -a /dev/sda5 :

ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always       -       36
  3 Spin_Up_Time            0x0027   253   162   021    Pre-fail  Always       -       833
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       167
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   100   253   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   095   095   000    Old_age   Always       -       4242
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       160
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       60
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       167
194 Temperature_Celsius     0x0022   107   106   000    Old_age   Always       -       43
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       3
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1
ATA Error Count: 136

Увы, только пять последних ошибок хранится. И они все абсолютно идентичны, различаются только номер и время (межно ними всеми примерно по три секунды). Раз сейчас Power_On_Hours   -  4242, то это вроде должны быть как раз вчерашние, вот последняя:

Error 136 occurred at disk power-on lifetime: 4219 hours (175 days + 19 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 00 9d 54 e2 e1  Error: UNC at LBA = 0x01e2549d = 31610013

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 40 7a 54 e2 01 08      00:27:10.110  READ DMA
  ec 00 00 00 00 00 00 08      00:27:10.102  IDENTIFY DEVICE
  ef 03 46 00 00 00 00 08      00:27:10.102  SET FEATURES [Set transfer mode]

Кому-нибудь это о чём-нибудь говорит? Какие ещё логи по теме могут быть?

Оффлайн Ivan Kravchenko

  • Новичок
  • *
  • Сообщений: 6
    • Просмотр профиля
Re: File system error -> fsck убила dpkg
« Ответ #8 : 29 Марта 2010, 22:04:23 »
Что-то этом мне смутно напоминает.

У метя тоже были похожие проблемы с зеленой серией только от Samsung.
Все свелось к тому, что пришлось выключить поддержку Smart  в биос.  Иначе стабильно сыпались ошибки интерфейса.
Пробуйте.


Пакеты, конечно, придется обновить за-ново.
Кстати. бекап это очень хорошая идея, rsync вам поможет.

Оффлайн jel

  • Активист
  • *
  • Сообщений: 828
    • Просмотр профиля
Re: File system error -> fsck убила dpkg
« Ответ #9 : 29 Марта 2010, 22:22:34 »
Пакеты надо ставить заново потому, что у нас издох список установленных пакетов и мы взяли его из бэкапа. Последние изменения в бэкапе не отражены поэтому и получилось что пакеты вроде как и обновлены, но dpkg об этом пока не знает и предлагает их обновить. Соглашайся. Конфиги при переустановке не должны пострадать (теоретически).

В смарте есть нехорошая строчка

197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       3

Это означает что 3 сектора не прочитались с первого раза и если они не прочитаются снова, то будут замещены резервными. В принципе это не страшно, хотя лучше бы их не было.

Судя по показанной ошибке - происходят они при чтении с диска в режиме DMA - не читается сектор. Виноваты могут быть и блины диска, и головки, и контроллер самого диска, кабель, контроллер на материнке и кривой драйвер. Для начала я бы покопал интернет на предмет аналогичных проблем с такими винтами под линуксом. Если явление носит массовый характер, то возможно попадется и решение проблемы. Если нет - наверное лучше купить другой винт, а этот использовать для менее ответственных целей.
« Последнее редактирование: 29 Марта 2010, 22:29:43 от jel »

Оффлайн newages

  • Новичок
  • *
  • Сообщений: 1
    • Просмотр профиля
Re: File system error -> fsck убила dpkg
« Ответ #10 : 30 Апреля 2010, 17:17:32 »
Если явление носит массовый характер, то возможно попадется и решение проблемы.
Носит )) это проявляется при обновлении предыдущих версий убунты до 10,04. Я на бета версию какие то обновления накатил неделю назад и у меня аналогичный результат

Оффлайн Sabiko

  • Автор темы
  • Новичок
  • *
  • Сообщений: 15
    • Просмотр профиля
Re: File system error -> fsck убила dpkg
« Ответ #11 : 20 Мая 2010, 04:58:58 »
Носит )) это проявляется при обновлении предыдущих версий убунты до 10,04. Я на бета версию какие то обновления накатил неделю назад и у меня аналогичный результат

У меня Коала пока. Хотя начало умирания тоже некоторым образом воспоследовало за обновлением с 9.04; надеюсь, просто совпадение.

Не знаю. Пока я решила, что моя паранойя по поводу софтовых причин необоснована. Из вещей общего характера нагуглилось только две:
1) неумение работать с жесткими зелёных серий - вроде как давно пофикшено. Плюс здесь проблема отражается в бешеном счётчике Start_Stop_Count, чего у меня не наблюдается.
2) проблемы с 4кб сектором, но у меня был EADS. На сайте WD, чтоб их, про размер сектора в характеристиках ни гу-гу. Но вроде только EARS?

Так что пока считаю, просто такое вот великолепное качество. По гарантии забрали без единого вопроса.

Зато у меня теперь суровый вопрос, чем заменить. Что-то сколько отзывы не читай, никакого просвета. Дохнет всё (о, где вы, старые идешные рыбы! ах да, на одной из них я сейчас временно, ей уже лет десять, SMART чист и прекрасен; кстати, процесс переноса системы очень порадовал, так просто), так что мой скудный опыт с двумя дохлыми WD, наверное, не повод от них отказываться. Пока у меня идиотская идея вместо трупа обзавестись файлопомойкой пожирнее и винтом под систему поменьше, и настроить rsync'ом бэкап всего на свете друг на друга.
Под файлопомойку, наверное, тот же WD зелёной серии, под систему пока не решила.  А то с одной стороны хочется тихо-холодно, с другой под систему и производительность бы побольше. Советы-предложения-подводные камни? Спросить в другом разделе? Или вообще мысль про два винта дурацкая?

upd. Купила рыбу 7200.12 на 250 и такой же зелёный WD на 750.  На рыбу буду винду и Ubuntu, надеюсь, справится достойно.
« Последнее редактирование: 21 Мая 2010, 01:53:31 от Sabiko »

Оффлайн Sabiko

  • Автор темы
  • Новичок
  • *
  • Сообщений: 15
    • Просмотр профиля
Re: File system error -> fsck убила dpkg
« Ответ #12 : 16 Сентября 2010, 09:06:55 »
Итак, по прошествии всего четырёх месяцев продолжение банкета.

Расклад по винтам: рыба 20Гб с Ubuntu 9.04; рыба 250Гб с коалой; зелёный WD7500AADS - файлопомойка с одним разделом в ext3.

Пока меня месяц не было дома, стали поступать сообщения, что файлопомойка иногда отваливается. Или видится, но "все файлы с замочками и ни один не открывается". Когда я приехала, мне уже даже файлов с замочками не осталось.

Диск с переменным успехом видится биосом. Есть доступ к смарту, вот он вчера:

=== START OF INFORMATION SECTION ===
Device Model:     WDC WD7500AADS-00M2B0
Serial Number:    WD-WCAV57972431
Firmware Version: 01.00A01
User Capacity:    750,156,374,016 bytes
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  Exact ATA specification draft version not indicated
Local Time is:    Tue Sep 14 20:47:36 2010 MSD
SMART support is: Available - device has SMART capability.
SMART support is: Enabled


SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   197   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   189   110   021    Pre-fail  Always       -       3508
  4 Start_Stop_Count        0x0032   098   098   000    Old_age   Always       -       2935
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       2231
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   098   098   000    Old_age   Always       -       2933
192 Power-Off_Retract_Count 0x0032   197   197   000    Old_age   Always       -       2896
193 Load_Cycle_Count        0x0032   191   191   000    Old_age   Always       -       29744
194 Temperature_Celsius     0x0022   121   097   000    Old_age   Always       -       26
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       7
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       6
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       3

SMART Error Log Version: 1

Error 610 occurred at disk power-on lifetime: 2231 hours (92 days + 23 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 50 00 00 e0  Error: UNC 8 sectors at LBA = 0x00000050 = 80

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 4f 00 00 e0 08      00:06:22.276  READ DMA
  ec 00 00 00 00 00 a0 08      00:06:22.267  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 08      00:06:22.260  SET FEATURES [Set transfer mode]

Error 609 occurred at disk power-on lifetime: 2231 hours (92 days + 23 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 50 00 00 e0  Error: UNC 8 sectors at LBA = 0x00000050 = 80

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 4f 00 00 e0 08      00:06:19.758  READ DMA
  ec 00 00 00 00 00 a0 08      00:06:19.750  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 08      00:06:19.750  SET FEATURES [Set transfer mode]

Но прогресс не стоит на месте и вот он сегодня:

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   197   051    Pre-fail  Always       -       132
  3 Spin_Up_Time            0x0027   210   110   021    Pre-fail  Always       -       2491
  4 Start_Stop_Count        0x0032   097   097   000    Old_age   Always       -       3028
  5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   097   097   000    Old_age   Always       -       2241
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   097   097   000    Old_age   Always       -       3026
192 Power-Off_Retract_Count 0x0032   197   197   000    Old_age   Always       -       2988
193 Load_Cycle_Count        0x0032   191   191   000    Old_age   Always       -       29751
194 Temperature_Celsius     0x0022   108   097   000    Old_age   Always       -       39
196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always       -       0
197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       8
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       6
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       3


Error 1915 occurred at disk power-on lifetime: 2240 hours (93 days + 8 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 50 00 00 e0  Error: UNC 8 sectors at LBA = 0x00000050 = 80

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 4f 00 00 e0 08      00:22:45.820  READ DMA
  ec 00 00 00 00 00 a0 08      00:22:45.788  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 08      00:22:45.788  SET FEATURES [Set transfer mode]

Error 1914 occurred at disk power-on lifetime: 2240 hours (93 days + 8 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  40 51 08 50 00 00 e0  Error: UNC 8 sectors at LBA = 0x00000050 = 80

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  c8 00 08 4f 00 00 e0 08      00:22:43.274  READ DMA
  ec 00 00 00 00 00 a0 08      00:22:43.250  IDENTIFY DEVICE
  ef 03 46 00 00 00 a0 08      00:22:43.243  SET FEATURES [Set transfer mode]

Надо заметить, что 6 дохлых секторов было сразу, как и несколько десятков ошибок на lifetime 0. Но до последнего месяца эти параметры не менялись, я иногда проверяла.

Реакция на попытку примонтировать:
Error mounting: mount exited with exit code 32: mount: wrong fs type, bad option, bad superblock on /dev/sdb1,
       missing codepage or helper program, or other error
       In some cases useful info is found in syslog - try
       dmesg | tail  or so

Реакция на попытку прочекать fsck:
sudo fsck /dev/sdb1
fsck from util-linux-ng 2.16
e2fsck 1.41.9 (22-Aug-2009)
fsck.ext3: Attempt to read block from filesystem resulted in short read while trying to open /dev/sdb1
Could this be a zero-length partition?

Результат проверки на бэдблоки выглядит несколько странно:
Checking blocks 0 to 732574583
Checking for bad blocks (read-only test): 0 0.00% done, 0:16 elapsed
400.00% done, 1:01 elapsed
410.00% done, 1:17 elapsed
420.00% done, 1:33 elapsed
430.00% done, 1:48 elapsed
44
45
46
47
218938592one, 37:12 elapsed
218938604one, 37:43 elapsed
218938605one, 37:58 elapsed
218938606one, 38:13 elapsed
218938607one, 38:29 elapsed
224063520one, 39:37 elapsed
224063521one, 39:52 elapsed
224063522one, 40:08 elapsed
224063523one, 40:23 elapsed
224160152one, 40:39 elapsed
224160160one, 41:10 elapsed
224160161one, 41:26 elapsed
224160162one, 41:41 elapsed
224160163one, 41:57 elapsed
224254744one, 42:13 elapsed
224254748one, 42:43 elapsed
224254749one, 42:58 elapsed
224254750one, 43:14 elapsed
224254751one, 43:30 elapsed
359381328one, 1:07:50 elapsed
359381384one, 1:08:21 elapsed
359381385one, 1:08:36 elapsed
359381386one, 1:08:52 elapsed
359381387one, 1:09:08 elapsed
362225024one, 1:09:55 elapsed
362225040one, 1:10:26 elapsed
362225041one, 1:10:41 elapsed
362225042one, 1:10:57 elapsed
362225043one, 1:11:13 elapsed
418119688one, 1:22:42 elapsed
418119724one, 1:23:13 elapsed
418119725one, 1:23:28 elapsed
418119726one, 1:23:44 elapsed
418119727one, 1:23:59 elapsed
done                                
Pass completed, 43 bad blocks found.

И наконец, кусок dmesg с 9.04:
[ 8596.215989] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[ 8596.215995] ata3.00: BMDMA stat 0x64
[ 8596.216003] ata3.00: cmd c8/00:08:4f:00:00/00:00:00:00:00/e0 tag 0 dma 4096 in
[ 8596.216005]          res 51/40:00:50:00:00/00:00:00:00:00/e0 Emask 0x9 (media error)
[ 8596.216022] ata3.00: status: { DRDY ERR }
[ 8596.216027] ata3.00: error: { UNC }
[ 8596.240943] ata3.00: configured for UDMA/133
[ 8596.256429] ata3.01: configured for UDMA/133
[ 8596.256446] ata3: EH complete
[ 8598.749514] ata3.00: exception Emask 0x0 SAct 0x0 SErr 0x0 action 0x0
[ 8598.749520] ata3.00: BMDMA stat 0x64
[ 8598.749529] ata3.00: cmd c8/00:08:4f:00:00/00:00:00:00:00/e0 tag 0 dma 4096 in
[ 8598.749530]          res 51/40:00:50:00:00/00:00:00:00:00/e0 Emask 0x9 (media error)
[ 8598.749534] ata3.00: status: { DRDY ERR }
[ 8598.749537] ata3.00: error: { UNC }
[ 8598.772450] ata3.00: configured for UDMA/133
[ 8598.788428] ata3.01: configured for UDMA/133
[ 8598.788442] sd 2:0:0:0: [sdb] Unhandled sense code
[ 8598.788445] sd 2:0:0:0: [sdb] Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[ 8598.788449] sd 2:0:0:0: [sdb] Sense Key : Medium Error [current] [descriptor]
[ 8598.788455] Descriptor sense data with sense descriptors (in hex):
[ 8598.788458]         72 03 11 04 00 00 00 0c 00 0a 80 00 00 00 00 00
[ 8598.788473]         00 00 00 50
[ 8598.788478] sd 2:0:0:0: [sdb] Add. Sense: Unrecovered read error - auto reallocate failed
[ 8598.788485] end_request: I/O error, dev sdb, sector 80
[ 8598.788500] ata3: EH complete
[ 8598.789008] EXT3-fs: can't read group descriptor 1

Весь печальный лог загрузки можно почитать тут.

Самое смешное, что с подключенным проблемным винтом грузилась только 9.04, а коала вываливалась в initramfs, сообщая мне, мол ALERT! Нет раздела c uuid (и тут uuid корневого раздела коалы). Drop u to shell.
Я файлопомойку даже из fstab выпилила - не повлияло. Надо ли говорить, что при отключении глючного винта все прекрасненько грузилось.
Суть этого волшебного глюка осталась неясной для меня. Поменяла коале в grub.cfg с uuid на /dev/sd* - загрузилась при подключенной файлопомойке. Увы, оная не заработала так же, как в 9.04. Так же реакция на монтирование и fsck. Но мне очень понравилось, что будет, если открыть Disk Utility и нажать там Check Filesystem. Сообщение очаровывает своей лаконичностью:

File system check on "750 GB Filesystem" (Partition 1 of ATA WDC WD7500AADS-00M2B0) completed
File system is NOT clean.

Конечно, даже на файлопомойке оказалось некоторые количество очень нужных файлов и, конечно же, незабэкапленных.

Собственно, вопросы:
1) Что происходит? Это железное умирание?
2) Можно ли вытащить хоть что-то? Если его на бэды можно прочекать, может, и к информации какой-то доступ есть?
3) Что за фигня была с незагрузкой коалы? Просто интересно.
« Последнее редактирование: 16 Сентября 2010, 09:11:17 от Sabiko »

Оффлайн jel

  • Активист
  • *
  • Сообщений: 828
    • Просмотр профиля
Re: WD green - видится, но не монтируется.
« Ответ #13 : 16 Сентября 2010, 12:00:01 »
Судя по логам и смарту винт практически мертв. Соответственно ответы:

1. Да, похоже что деградирует поверхность блинов.
2. Можно попробовать родным tesdisk-ом или неправославной R-Studio. Судя по логам некоторые сектора в которых размещены критически важные структуры файловой системы уже не читаются.
3. В коале, если мне не изменяет память, init был заменен на upstart, соответственно изменился и порядок загрузки системы. Возможно поэтому коала и не могла загрузиться.

Оффлайн andrey_4j

  • Активист
  • *
  • Сообщений: 256
    • Просмотр профиля
Re: WD green - видится, но не монтируется.
« Ответ #14 : 16 Сентября 2010, 15:03:31 »
Меня эта тема заинтересовала тем, что нечто похожее наблюдал ок. 2-х лет назад со своей машиной. У меня тогда стоял 500 ГБ Seagate 7200.11, и я для файлопомойки купил WD 640 ГБ (но не грин: WDC WD6401AALS-0 - как раз только-только появились в продаже). И через некоторое время смотрю, а с винтами что-то не то творится. Я тогда еще на винде сидел. Крутил и так и по-другому, проверял всяческими утилитами и все, казалось бы, сводилось к умиранию винта... И попытки переустановить систему порой упирались в проблемы с винтом, так же я тогда начал пробовать и альтернативы винде, думая, что это поможет (первой попыткой была мандрива фри 2009.1 спринг, но это уже другой разговор). Но что-то мне подсказало, что это не так. Я проверил на другом компе - оба винта ОК. Тогда я поменял материнку (была Elitegroup на 33 чипсете, сейчас - Asus на 43-м) - и вот полтора года совершенно никаких проблем. Так что не исключено, что дело в контроллере.
Tekigo wakaraba ayauki shichibai. Если знаешь язык врага, будешь в 7 раз опасней для него. (Японская пословица)

 

Страница сгенерирована за 0.063 секунд. Запросов: 24.