Форум русскоязычного сообщества Ubuntu


Получить помощь и пообщаться с другими пользователями Ubuntu можно
на irc канале #ubuntu-ru в сети Freenode
и в Jabber конференции ubuntu@conference.jabber.ru

Автор Тема: EDAC (Error Detection and Correction)  (Прочитано 27348 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн connection

  • Автор темы
  • Новичок
  • *
  • Сообщений: 48
    • Просмотр профиля
EDAC (Error Detection and Correction)
« : 06 Декабря 2022, 18:15:00 »
привет форум.  есть серверное железо(CPU XEON E5-269* и DDR4) смотрю dmesg и вижу
CPU SrcID #0, Ha #0, Channel #0 has DIMMs, but ECC is disabled


в ядре  в Device Driver в EDAC ERROR DETECTION AND CORRECTION
EDAC legacy sysfs                                                   
  [*]   Debugging                                                             
  [*]   Output ACPI APEI/GHES BIOS detected errors via EDAC                   
  <M>   Intel e752x (e7520, e7525, e7320) and 3100                           
  <M>   Intel 82975x (D82975x)                                               
  <M>   Intel 3000/3010                                                     
  <M>   Intel 3200                                                           
  <M>   Intel e312xx                                                       
  <M>   Intel X38                                                           
  <M>   Intel 5400 (Seaburg) chipsets                                       
  <M>   Intel i7 Core (Nehalem) processors                                   
  <M>   Intel Greencreek/Blackford chipset                                   
  <M>   Intel San Clemente MCH                                               
  <M>   Intel Clarksboro MCH                                                 
  <M>   Intel Sandy-Bridge/Ivy-Bridge/Haswell Integrated MC                 
  <M>   Intel Skylake server Integrated MC                                   
  <M>   Intel 10nm server Integrated MC                                     
  <M>   Intel Pondicherry2                                                   
  < >   Intel client SoC Integrated MC (NEW)                                 
                                                                             

память проверена: ошибки не выдает.  ECC поддерживает. 
модуль  Intel Sandy-Bridge/Ivy-Bridge/Haswell Integrated MC включен   
и EDAC работает , ошибки выдает, но они не корректируются. наверное я что-то не так понял, может посовету умных людей нужно было просто вырубить EDAC в ядре или сбросить ошибки в null, но думаю это неправильно.   возможно нужен правильный патч, подскажите если знаете такой. просто хочется понять почему не работает  ECC и как это исправить.  железо впорядке, тогда остаются только софтовые проблемы.  в них я совсем не разбираюсь, но хочу научиться, поэтому обратился к вам, к тем кто в теме.  помогите разобраться
« Последнее редактирование: 07 Декабря 2022, 04:13:15 от connection »

Оффлайн ALiEN175

  • Администратор
  • Старожил
  • *
  • Сообщений: 6578
  • 20% Cooler
    • Просмотр профиля
Re: EDAC
« Ответ #1 : 06 Декабря 2022, 18:24:58 »
а плашки памяти с ECC?
🖥 AsRock B550M Pro4 :: AMD Ryzen 5 3600 :: 16 GB DDR4 :: AMD Radeon RX 6600 :: XFCE
💻 ACER 5750G :: Intel Core i5-2450M :: 6 GB DDR3 :: GeForce GT 630M :: XFCE

Оффлайн connection

  • Автор темы
  • Новичок
  • *
  • Сообщений: 48
    • Просмотр профиля
Re: EDAC
« Ответ #2 : 06 Декабря 2022, 18:53:51 »
там все серверное, и чипсет и проц, и ddr c коррекцией ошибок. управляет всем этим конечно же Ubun_точка

Пользователь добавил сообщение 06 Декабря 2022, 18:58:25:
а плашки памяти с ECC?
и вот еще
нашел
Couldn't find mci handler
 Failed to register device with error -19.
« Последнее редактирование: 06 Декабря 2022, 18:58:25 от connection »

Оффлайн bezbo

  • Старожил
  • *
  • Сообщений: 1728
    • Просмотр профиля
Re: EDAC
« Ответ #3 : 06 Декабря 2022, 19:40:41 »
sudo lshw -class memory?

Оффлайн connection

  • Автор темы
  • Новичок
  • *
  • Сообщений: 48
    • Просмотр профиля
Re: EDAC
« Ответ #4 : 06 Декабря 2022, 19:55:01 »
lshw -class memory
description: System Memory
       physical id: 56
       slot: System board or motherboard
     *-bank:0
          description: DIMM Synchronous 2400 MHz (0,4 ns)
          product: HMA41GR7AFR4N-UH
          vendor: Hynix Semiconductor
          physical id: 0
          serial: 51896692
          slot: DIMM_A1
          size: 8GiB




Оффлайн bezbo

  • Старожил
  • *
  • Сообщений: 1728
    • Просмотр профиля
Re: EDAC
« Ответ #5 : 06 Декабря 2022, 21:20:12 »
sudo dmidecode -t memory?

Оффлайн connection

  • Автор темы
  • Новичок
  • *
  • Сообщений: 48
    • Просмотр профиля
Re: EDAC
« Ответ #6 : 06 Декабря 2022, 21:37:09 »
sudo dmidecode -t memory?
уважаемый bezbo, я же выдал  вывод. эта память может  ECC

Оффлайн bezbo

  • Старожил
  • *
  • Сообщений: 1728
    • Просмотр профиля
Re: EDAC
« Ответ #7 : 06 Декабря 2022, 21:41:40 »
я же выдал  вывод

к сожалению, не вижу вывода команды "sudo lshw -class memory"

Оффлайн connection

  • Автор темы
  • Новичок
  • *
  • Сообщений: 48
    • Просмотр профиля
Re: EDAC
« Ответ #8 : 06 Декабря 2022, 21:49:52 »
я же выдал  вывод

к сожалению, не вижу вывода команды "sudo lshw -class memory"
вот еще что посоветовали разместить дабы помочь уважаемым форумчанам понять что же происходит на самом деле
Dec  4 08:08:29 i kernel: [   13.525285] EDAC DEBUG: get_dimm_config: mc#0: Node ID: 0, source ID: 0
Dec  4 08:08:29 i kernel: [   13.525288] EDAC DEBUG: get_dimm_config: Memory mirroring is disabled
Dec  4 08:08:29 i kernel: [   13.525290] EDAC DEBUG: get_dimm_config: Lockstep is disabled
Dec  4 08:08:29 i kernel: [   13.525290] EDAC DEBUG: get_dimm_config: address map is on open page mode
Dec  4 08:08:29 i kernel: [   13.525293] EDAC DEBUG: __populate_dimms: Memory is registered
Dec  4 08:08:29 i kernel: [   13.525295] EDAC sbridge: CPU SrcID #0, Ha #0, Channel #0 has DIMMs, but ECC is disabled
Dec  4 08:08:29 i kernel: [   13.525299] EDAC DEBUG: sbridge_register_mci: MC: failed to get_dimm_config()
Dec  4 08:08:29 i kernel: [   13.525300] EDAC DEBUG: edac_mc_free:
Dec  4 08:08:29 i kernel: [   13.525309] EDAC DEBUG: sbridge_unregister_mci: MC: dev = 00000000eb7b6542
Dec  4 08:08:29 i kernel: [   13.525309] EDAC sbridge: Couldn't find mci handler
Dec  4 08:08:29 i kernel: [   13.525311] EDAC DEBUG: sbridge_unregister_mci: MC: dev = 00000000d8f0f9a6
Dec  4 08:08:29 i kernel: [   13.525312] EDAC sbridge: Couldn't find mci handler




может это поможет прояснить картину?

product: HMA41GR7AFR4N-UH
vendor: Hynix Semiconductor
Это вот такая

 https://memory.net/product/hma41gr7afr4n-uh-sk-hynix-1x-8gb-ddr4-2400-rdimm-pc4-19200t-r-single-rank-x4-module/ 
   
и  она  может ECC


 
« Последнее редактирование: 07 Декабря 2022, 04:15:35 от connection »

 

Страница сгенерирована за 0.027 секунд. Запросов: 25.