Приветствую всех!
Пытаюсь подружить агрегированный канал из 4-х гигабитных сетевых карточек под управлением Ubuntu Server 12.04 и коммутатор D-Link DGS-3200-24, и к сожалению, ничего у меня не получается, поэтому буду признателен за любую подсказку куда смотреть и в чём может быть быть проблема.
Итак, есть ОС в серверном варианте Ubuntu Server 12.04
Linux router 3.2.0-24-generic-pae #37-Ubuntu SMP Wed Apr 25 10:47:59 UTC 2012 i686 i686 i386 GNU/Linux
которая стоит на сервере с 4-мя сетевыми картами D-Link DGE-530T и встроенной сетевой картой Intel PRO 100(её в расчёт не берём)
# PCI device 0x1186:/sys/devices/pci0000:00/0000:00:01.0 (r8169)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="5c:d9:98:f5:61:5c", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth1"
# PCI device 0x1186:/sys/devices/pci0000:01/0000:01:02.0 (r8169)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="5c:d9:98:f5:7b:0d", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth3"
# PCI device 0x1186:/sys/devices/pci0000:00/0000:00:02.0 (r8169)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="5c:d9:98:f5:66:e2", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth2"
# PCI device 0x8086:/sys/devices/pci0000:00/0000:00:06.0 (e100)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:30:48:25:38:1d", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth0"
# PCI device 0x1186:/sys/devices/pci0000:01/0000:01:01.0 (skge)
SUBSYSTEM=="net", ACTION=="add", DRIVERS=="?*", ATTR{address}=="00:1b:11:19:7b:7d", ATTR{dev_id}=="0x0", ATTR{type}=="1", KERNEL=="eth*", NAME="eth4"
эти 4 карты собраны в агрегированный канал 4 Гб/c по протоколу LACP, но в 4-ую карту кабель пока не вставлен
Ethernet Channel Bonding Driver: v3.7.1 (April 27, 2011)
Bonding Mode: IEEE 802.3ad Dynamic link aggregation
Transmit Hash Policy: layer2 (0)
MII Status: up
MII Polling Interval (ms): 100
Up Delay (ms): 200
Down Delay (ms): 200
802.3ad info
LACP rate: fast
Min links: 0
Aggregator selection policy (ad_select): stable
Active Aggregator Info:
Aggregator ID: 4
Number of ports: 1
Actor Key: 17
Partner Key: 21
Partner Mac Address: 00:24:01:fc:36:63
Slave Interface: eth2
MII Status: up
Speed: 1000 Mbps
Duplex: full
Link Failure Count: 74
Permanent HW addr: 5c:d9:98:f5:66:e2
Aggregator ID: 3
Slave queue ID: 0
Slave Interface: eth4
MII Status: up
Speed: Unknown
Duplex: Unknown
Link Failure Count: 0
Permanent HW addr: 00:1b:11:19:7b:7d
Aggregator ID: 2
Slave queue ID: 0
Slave Interface: eth3
MII Status: up
Speed: 100 Mbps
Duplex: full
Link Failure Count: 132
Permanent HW addr: 5c:d9:98:f5:7b:0d
Aggregator ID: 1
Slave queue ID: 0
Slave Interface: eth1
MII Status: up
Speed: 1000 Mbps
Duplex: full
Link Failure Count: 2
Permanent HW addr: 5c:d9:98:f5:61:5c
Aggregator ID: 4
Slave queue ID: 0
уже видно что на 2-м интерфейсе имеется значительное количество сбоев соединения, а на 3-м помимо большого количества сбоев соединения ещё почему-то и выставлена скорость 100 Мб/с(хотя карта гигабитная), теперь если посмотреть на состояние линков, то на агрегированном канале имеется огромное число дропнутых пакетов
bond0 Link encap:Ethernet HWaddr 5c:d9:98:f5:66:e2
inet addr:10.0.0.12 Bcast:10.0.0.255 Mask:255.255.255.0
inet6 addr: fe80::5ed9:98ff:fef5:66e2/64 Scope:Link
UP BROADCAST RUNNING MASTER MULTICAST MTU:1500 Metric:1
RX packets:33723 errors:0 dropped:10485 overruns:0 frame:0
TX packets:13969 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:3112632 (3.1 MB) TX bytes:1839300 (1.8 MB)
eth0 Link encap:Ethernet HWaddr 00:30:48:25:38:1d
UP BROADCAST MULTICAST MTU:1500 Metric:1
RX packets:0 errors:0 dropped:0 overruns:0 frame:0
TX packets:0 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:0 (0.0 B) TX bytes:0 (0.0 B)
eth1 Link encap:Ethernet HWaddr 5c:d9:98:f5:66:e2
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:28715 errors:0 dropped:13 overruns:0 frame:0
TX packets:8506 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:2491640 (2.4 MB) TX bytes:1161946 (1.1 MB)
Interrupt:16 Base address:0xce00
eth2 Link encap:Ethernet HWaddr 5c:d9:98:f5:66:e2
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:36 errors:0 dropped:27 overruns:0 frame:0
TX packets:341 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:4464 (4.4 KB) TX bytes:42226 (42.2 KB)
Interrupt:18 Base address:0xef00
eth3 Link encap:Ethernet HWaddr 5c:d9:98:f5:66:e2
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:4972 errors:0 dropped:4972 overruns:0 frame:0
TX packets:5122 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:616528 (616.5 KB) TX bytes:635128 (635.1 KB)
Interrupt:26 Base address:0x8c00
eth4 Link encap:Ethernet HWaddr 5c:d9:98:f5:66:e2
UP BROADCAST RUNNING SLAVE MULTICAST MTU:1500 Metric:1
RX packets:0 errors:0 dropped:0 overruns:0 frame:0
TX packets:0 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:1000
RX bytes:0 (0.0 B) TX bytes:0 (0.0 B)
Interrupt:24
lo Link encap:Local Loopback
inet addr:127.0.0.1 Mask:255.0.0.0
inet6 addr: ::1/128 Scope:Host
UP LOOPBACK RUNNING MTU:16436 Metric:1
RX packets:76 errors:0 dropped:0 overruns:0 frame:0
TX packets:76 errors:0 dropped:0 overruns:0 carrier:0
collisions:0 txqueuelen:0
RX bytes:5720 (5.7 KB) TX bytes:5720 (5.7 KB)
пинг с этой машины на другую выглядит в итоге так
--- 10.0.0.1 ping statistics ---
1000 packets transmitted, 956 received, 4% packet loss, time 999041ms
rtt min/avg/max/mdev = 0.099/0.224/5.681/0.327 ms
как видим имеется потеря пакетов в 4%. Но если теперь смотреть вывод netstat -i, то вроде в ядре всё хорошо
Kernel Interface table
Iface MTU Met RX-OK RX-ERR RX-DRP RX-OVR TX-OK TX-ERR TX-DRP TX-OVR Flg
bond0 1500 0 42915 0 13718 0 17696 0 0 0 BMmRU
eth0 1500 0 0 0 0 0 0 0 0 0 BMU
eth1 1500 0 36290 0 13 0 10558 0 0 0 BMsRU
eth2 1500 0 37 0 28 0 400 0 0 0 BMsRU
eth3 1500 0 6588 0 6588 0 6738 0 0 0 BMsRU
eth4 1500 0 0 0 0 0 0 0 0 0 BMsRU
lo 16436 0 96 0 0 0 96 0 0 0 LRU
Теперь если посмотреть состояние агрегации на коммутаторе, то в группе 5 видим что активен только порт 21 хотя прописаны порты с 21 по 23
DGS-3200-24:4#show link_aggregation
Command: show link_aggregation
Link Aggregation Algorithm = MAC-Source-Dest
Group ID : 1
Type : LACP
Master Port : 3
Member Port : 3-4
Active Port : 3-4
Status : Enabled
Group ID : 2
Type : LACP
Master Port : 13
Member Port : 13-14
Active Port : 13-14
Status : Enabled
Group ID : 3
Type : LACP
Master Port : 15
Member Port : 15-16
Active Port : 15-16
Status : Enabled
Group ID : 4
Type : LACP
Master Port : 17
Member Port : 17-20
Active Port : 17-20
Status : Enabled
Group ID : 5
Type : LACP
Master Port : 21
Member Port : 21-23
Active Port : 23
Status : Enabled
Total Entries : 5
Буду благодарен за любую помощь.