600 Вт на 9 дисков маловато.
Проверь память на битые ячейки мемтестом из меню GRUB. Что за контроллер, интегрированный или внешний, что за мать? Дистрибутив? больше информации.
Ну раньше 450 Ватт 10 винчестеров тянуло. Позже поставили мощнее БЖ.
С памятью... хм. Постараюсь проверить, 2 ГБ долго будит тестить ?
root@dionis:/home/trek# uname -a
Linux dionis 2.6.32-32-generic-pae #62-Ubuntu SMP Wed Apr 20 22:10:33 UTC 2011 i686 GNU/Linux
root@dionis:/home/trek# lspci
00:00.0 Host bridge: Intel Corporation 82945G/GZ/P/PL Memory Controller Hub (rev 02)
00:02.0 VGA compatible controller: Intel Corporation 82945G/GZ Integrated Graphics Controller (rev 02)
00:1c.0 PCI bridge: Intel Corporation N10/ICH 7 Family PCI Express Port 1 (rev 01)
00:1c.1 PCI bridge: Intel Corporation N10/ICH 7 Family PCI Express Port 2 (rev 01)
00:1c.3 PCI bridge: Intel Corporation N10/ICH 7 Family PCI Express Port 4 (rev 01)
00:1c.4 PCI bridge: Intel Corporation 82801GR/GH/GHM (ICH7 Family) PCI Express Port 5 (rev 01)
00:1c.5 PCI bridge: Intel Corporation 82801GR/GH/GHM (ICH7 Family) PCI Express Port 6 (rev 01)
00:1d.0 USB Controller: Intel Corporation N10/ICH7 Family USB UHCI Controller #1 (rev 01)
00:1d.1 USB Controller: Intel Corporation N10/ICH 7 Family USB UHCI Controller #2 (rev 01)
00:1d.2 USB Controller: Intel Corporation N10/ICH 7 Family USB UHCI Controller #3 (rev 01)
00:1d.3 USB Controller: Intel Corporation N10/ICH 7 Family USB UHCI Controller #4 (rev 01)
00:1d.7 USB Controller: Intel Corporation N10/ICH 7 Family USB2 EHCI Controller (rev 01)
00:1e.0 PCI bridge: Intel Corporation 82801 PCI Bridge (rev e1)
00:1f.0 ISA bridge: Intel Corporation 82801GB/GR (ICH7 Family) LPC Interface Bridge (rev 01)
00:1f.1 IDE interface: Intel Corporation 82801G (ICH7 Family) IDE Controller (rev 01)
00:1f.2 IDE interface: Intel Corporation N10/ICH7 Family SATA IDE Controller (rev 01)
00:1f.3 SMBus: Intel Corporation N10/ICH 7 Family SMBus Controller (rev 01)
01:00.0 Ethernet controller: Intel Corporation 82540EM Gigabit Ethernet Controller (rev 02)
01:01.0 RAID bus controller: Silicon Image, Inc. SiI 3512 [SATALink/SATARaid] Serial ATA Controller (rev 01)
01:03.0 Mass storage controller: Integrated Technology Express, Inc. ITE 8211F Single Channel UDMA 133 (rev 11)
06:00.0 SATA controller: JMicron Technology Corp. JMB362/JMB363 Serial ATA Controller (rev 03)
06:00.1 IDE interface: JMicron Technology Corp. JMB362/JMB363 Serial ATA Controller (rev 03)
-
Statistics
----------
-IP-
41485485 : Total packets received
97 : With invalid addresses
0 : Incoming packets discarded
0 : Incoming packets discarded
41485367 : Incoming packets delivered
20962814 : Requests sent out
64117 : Fragments received ok
128234 : Fragments created
-ICMP-
3747 : ICMP messages received
0 : ICMP messages failed
2617 : ICMP messages sent
0 : ICMP messages failed
-ICMPMSG-
-TCP-
25673 : Active connections openings
26324 : Passive connection openings
409 : Failed connection attempts
199 : Connection resets received
18 : Connections established
41049331 : Segments received
20415325 : Segments send out
116297 : Segments retransmited
0 : Bad segments received.
186 : Resets sent
-UDP-
429245 : Packets received
2281 : Packets to unknown port received.
478 : Packet receive errors
428468 : Packets sent
-UDPLITE-
-TCPEXT-
5 : Invalid SYN cookies received
11 : Resets received for embryonic SYN_RECV sockets
25187 : TCP sockets finished time wait in fast timer
7462 : Delayed acks sent
51 : Delayed acks further delayed because of locked socket
6858408 : Packets directly queued to recvmsg prequeue.
2503150212 : Bytes directly in process context from backlog
1310097975 : Bytes directly received in process context from prequeue
11773757 : Packet headers predicted
22869348 : Packets header predicted and directly queued to user
1647466 : Acknowledgments not containing data payload received
4589150 : Predicted acknowledgments
55966 : Times recovered from packet loss by selective acknowledgements
1 : Congestion windows recovered without slow start after partial ack
1 : Congestion windows recovered without slow start after partial ack
68334 : TCP data loss events
23 : Timeouts after SACK recovery
114823 : Fast retransmits
203 : Forward retransmits
314 : Retransmits in slow start
455 : Other TCP timeouts
64 : SACK retransmits failed
25 : Times receiver scheduled too late for direct processing
19 : DSACKs sent for old packets
111 : DSACKs received
76 : Connections reset due to unexpected data
390 : Connections aborted due to timeout
-IPEXT-
Shared Directories
------------------
-SAMBA-
-NFS-
/films/25/movies/_logs
Benchmarks
**********
CPU Blowfish
------------
-CPU Blowfish-
<big><b>This Machine</b></big> 2533 MHz 27,273
Intel(R) Celeron(R) M processor 1.50GHz (null) 26.1876862
PowerPC 740/750 (280.00MHz) (null) 172.816713
CPU CryptoHash
--------------
-CPU CryptoHash-
<big><b>This Machine</b></big> 2533 MHz 51,470
CPU Fibonacci
-------------
-CPU Fibonacci-
<big><b>This Machine</b></big> 2533 MHz 5,019
Intel(R) Celeron(R) M processor 1.50GHz (null) 8.1375674
PowerPC 740/750 (280.00MHz) (null) 58.07682
CPU N-Queens
------------
-CPU N-Queens-
<big><b>This Machine</b></big> 2533 MHz 12,947
FPU FFT
-------
-FPU FFT-
<big><b>This Machine</b></big> 2533 MHz 11,036
FPU Raytracing
--------------
-FPU Raytracing-
<big><b>This Machine</b></big> 2533 MHz 41,068
Intel(R) Celeron(R) M processor 1.50GHz (null) 40.8816714
PowerPC 740/750 (280.00MHz) (null) 161.312647
Пользователь решил продолжить мысль 07 Ноября 2012, 17:05:23:
TrEK, если виснет всегда в одно и то же время, то может быть проблема с питанием. Переключение в электросетях обычно производят в одно время и всегда с небольшим скачком. (Было такое, оказалось что плохие контакты на АКБ в УПСе, поджал и все нормально.)
С питанием менее всего вероятно.. здесь еще 4 сервера, с ними все ок. Кроме того там хороший резерв + защита от перепадов и т.д.
Пользователь решил продолжить мысль 07 Ноября 2012, 17:26:57:
root@dionis:/home/trek# lsb_release -d
Description: Ubuntu 10.04.2 LTS
Пользователь решил продолжить мысль 07 Ноября 2012, 19:43:10:
ПРотестил память, с ней рпоблем нету.
Как протестить хватает ли БЖ !?
Пользователь решил продолжить мысль 08 Ноября 2012, 11:25:19:
И так, как выяснилось после пару ребутов перестал монтироваться один из винчестеров.
Проверил в биосе, нету все таки его. Винчестер подключен через pci-sata-контроллер.
Покачто не знаю, проблема ли с винчестером или контролером. Но судя по всему система висла из-за винта. Раньше отваливались жесткие диски, которые были подключены в IDE либо САТА-порт, а в этот раз проблема через САТА-контроллер... и сервер "умирал"..
Пользователь решил продолжить мысль 08 Ноября 2012, 11:40:37:
.
.
.
.
.
.
.
Ах да, еще один нюанс, этот винт WD 2 TB green, был прикручен на ребро, то есть работал в непривычном для винчетсеров положении. Могло ли это повлиять ?