Форум русскоязычного сообщества Ubuntu


Следите за новостями русскоязычного сообщества Ubuntu в Twitter-ленте @ubuntu_ru_loco

Автор Тема: Сеть пропадает до перезагрузки соединения (проводное подключение)  (Прочитано 109356 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн acetone

  • Автор темы
  • Участник
  • *
  • Сообщений: 168
    • Просмотр профиля
    • Fediverse
Ubuntu 22.04, но до этого пробовал на другом Debian-подобном дистрибутиве.

Предыстория такая: новая мать Aorus. После сборки новая машина без нареканий работала полгода. Дело дошло до переезда и вот тут началось: машина теряла пинги в локальной сети сначала где-то раз в сутки-двое, а позже затыки начали случаться чуть ли не каждый час. Помогает перезагрузка службы networking. Коллизии IP-адресов в локальной сети нет. Грешил на провайдера, который "втюхал" мне плохой роутер, но после замены роутера ничего не изменилось. При этом остальные устройства в сети (пара лэптопов, еще один ПК и смартфоны) работали и работают отлично. В попытках поправить ситуацию "на коленке" купил USB-сетевую карту, думая, что проблема может быть в родном сетевом интерфейсе новой материнки. Но нет, и это не помогло. Также перепроверил и пару раз заменил сетевой кабель - без результата.

Пару дней назад поставил Ubuntu 22.04 на проблемную машину, понадеялся, что ошибка могла быть программной и с новой ОС все забудется, как страшный сон. В локальной сети два устройства и DHCP сервер, коллизии исключены. Однако, не прошло и двух суток, как случился затык: пинги в локальной сети не ходят, интернета, собственно, на "проблемном пациенте" нет. Как по мановению волшебной палочки, после команды systemctl restart networking все заработало как ни в чем не бывало. Остальные устройства в сети работали и работают штатно...

Понял, что проблему надо решать, а не бежать от нее. Было ли у кого-то подобное? Скажите какие аутпуты нужно дать, чтобы предположить диагноз и, возможно, коллективным разумом решить эту беду.
« Последнее редактирование: 19 Марта 2023, 14:46:16 от acetone »
Пошутил про демона - нажал иконку.

Оффлайн ALiEN

  • Администратор
  • Старожил
  • *
  • Сообщений: 6690
  • 20% Cooler
    • Просмотр профиля
в логи гляньте, может что интересное будет.
sudo dmesg | tail
journalctl | tail
🖥 AsRock B550M Pro4 :: AMD Ryzen 5 3600 :: 16 GB DDR4 :: AMD Radeon RX 6600 :: XFCE
💻 ACER 5750G :: Intel Core i5-2450M :: 6 GB DDR3 :: GeForce GT 630M :: XFCE

Оффлайн acetone

  • Автор темы
  • Участник
  • *
  • Сообщений: 168
    • Просмотр профиля
    • Fediverse
Сообразил простой скрипт для проверки обрывов в локальной сети

for((;;)); do
  ping 192.168.161.100 -c 1 &> /dev/null
  if [[ $? != 0 ]]; then
    date
    dmesg | tail >> dmesg.log
    echo -e "\n\n" >> dmesg.log

    journalctl | tail >> journal.log
    echo -e "\n\n" >> journal.log
  fi
  sleep 1
done

За полдня было три сработки с периодичностью около часа:
Пн 13 мар 2023 10:03:28 MSK
Пн 13 мар 2023 11:01:04 MSK
Пн 13 мар 2023 12:32:03 MSK

journalctl совсем ничего интересного не показывает, а лог dmesg имеет следующий вид (при всех трех обрывах содержимое не менялось):

[73797.363306] usb 1-6.2: New USB device strings: Mfr=4, Product=40, SerialNumber=0
[73797.363307] usb 1-6.2: Product: Wired Mouse
[73797.363308] usb 1-6.2: Manufacturer: KYE SYSTEMS CORP.
[73797.368540] input: KYE SYSTEMS CORP. Wired Mouse as /devices/pci0000:00/0000:00:14.0/usb1/1-6/1-6.2/1-6.2:1.0/0003:0458:0186.0016/input/input33
[73797.368589] hid-generic 0003:0458:0186.0016: input,hidraw5: USB HID v1.11 Mouse [KYE SYSTEMS CORP. Wired Mouse] on usb-0000:00:14.0-6.2/input0
[73797.368645] usbhid 1-6.2:1.1: couldn't find an input interrupt endpoint
[91611.589670] perf: interrupt took too long (3972 > 3962), lowering kernel.perf_event_max_sample_rate to 50250
[110658.673157] audit: type=1400 audit(1678654808.634:29): apparmor="DENIED" operation="capable" profile="/usr/sbin/cupsd" pid=171486 comm="cupsd" capability=12  capname="net_admin"
[110658.691980] audit: type=1400 audit(1678654808.654:30): apparmor="DENIED" operation="capable" profile="/usr/sbin/cups-browsed" pid=171516 comm="cups-browsed" capability=23  capname="sys_nice"
[145438.306107] perf: interrupt took too long (4970 > 4965), lowering kernel.perf_event_max_sample_rate to 40000

Караулю полный затык. Может быть при нем какие-то данные все-таки попадут в указанные выше логи.

Пользователь добавил сообщение 13 Марта 2023, 14:37:06:
Случился затык.

dmesg:

[159598.194193] usb 1-6-port2: disabled by hub (EMI?), re-enabling...
[159598.194629] usb 1-6.2: USB disconnect, device number 24
[159598.480922] usb 1-6.2: new low-speed USB device number 25 using xhci_hcd
[159598.586761] usb 1-6.2: New USB device found, idVendor=0458, idProduct=0186, bcdDevice=24.58
[159598.586774] usb 1-6.2: New USB device strings: Mfr=4, Product=40, SerialNumber=0
[159598.586779] usb 1-6.2: Product: Wired Mouse
[159598.586782] usb 1-6.2: Manufacturer: KYE SYSTEMS CORP.
[159598.592904] input: KYE SYSTEMS CORP. Wired Mouse as /devices/pci0000:00/0000:00:14.0/usb1/1-6/1-6.2/1-6.2:1.0/0003:0458:0186.0017/input/input34
[159598.593180] hid-generic 0003:0458:0186.0017: input,hidraw5: USB HID v1.11 Mouse [KYE SYSTEMS CORP. Wired Mouse] on usb-0000:00:14.0-6.2/input0
[159598.593284] usbhid 1-6.2:1.1: couldn't find an input interrupt endpoint

В journalctl вроде как ничего полезного. В лог попал только перезапуск networking, до этого - праздные сообщения, не касающиеся сети:

(Нажмите, чтобы показать/скрыть)

Не хватает навыков, чтобы понять в какую сторону еще копать логи в момент сетевой ошибки (затыка, когда пропадают все пинги)...

Пользователь добавил сообщение 13 Марта 2023, 16:04:11:
Буду снова ждать затык. Сниму дамп сетевых пакетов wireshark'ом, а также проверю наличие пингов на 127.0.0.1.

Пользователь добавил сообщение 13 Марта 2023, 19:46:04:
Снова пропала сеть. На этот раз не прошло и половины дня. В прошлый раз, как я написал в первом посте, на другой Debian-подобной ОС было аналогичное поведение: сначала раз в сутки-двое, а затем затыки участились.

Проверил пинги во время "затыка" сети: все локальные интерфейсы пингуются, как 127.0.0.1/8, так и 192.168.161.252/24. При этом пара машин в локальной сети являются недоступными, а так как одна из них - маршрутизатор, то и доступа в интернет нет.

Запустил wireshark. Все что он поймал на интерфейсе: ARP запросы с поиском машин пингуемых мной адресов 192.168.161.1 и 192.168.161.100. Прикладываю на всякий случай PCAP-файл, если кто-то захочет увидеть это пассивное поведение сети без единого левого пакетика: https://paste.i2pd.xyz/?b7e382b8d413e679#94qukKFdntWWzdgAjqwhqtFrHdxz4MNam18fYwKJZuwb.

Как и раньше: только сделал рестарт networking - вся сеть завелась, пинги побежали и прочее. Что за магия, седых волос уже не хватает  :-[
« Последнее редактирование: 13 Марта 2023, 19:46:04 от acetone »
Пошутил про демона - нажал иконку.

Оффлайн acetone

  • Автор темы
  • Участник
  • *
  • Сообщений: 168
    • Просмотр профиля
    • Fediverse
Получил важное наблюдение: во время затыка, когда WireShark видит только мои ARP-запросы локальных адресов, которые я пытаюсь (безуспешно) пинговать, ситуацию спасает не только рестарт networking, но и простое физическое перетыкание Ethernet-кабеля: отключил-включил и - все пакеты побежали как было задумано творцом.

Менял Ethernet-кабель четыре раза. Сейчас использую патчкорд из магазина с заводской обжимкой. На обжимку грешить не могу - работает как и предыдущие кабели: с хорошим пингом и стабильным каналом. Но раз в какой-то необъяснимый промежуток случается полная потеря сети...
Пошутил про демона - нажал иконку.

Оффлайн Usermaster

  • СуперМодератор
  • Старожил
  • *
  • Сообщений: 2537
    • Просмотр профиля
спасает не только рестарт networking, но и простое физическое перетыкание Ethernet-кабеля: отключил-включил и - все пакеты побежали как было задумано творцом.
Возможно проблема в маршрутизаторе?

Оффлайн acetone

  • Автор темы
  • Участник
  • *
  • Сообщений: 168
    • Просмотр профиля
    • Fediverse
Возможно проблема в маршрутизаторе?

Маршрутизатор менялся трижды (два модема от провайдера и сейчас второй ПК в сети, выступающий маршрутизатором и DHCP). В момент таинственной проблемы пинги пропадают не только до условного 8.8.8.8, но и до всех локальных устройств, которые находятся в одной подсети с пациентом. В свою очередь, остальная локалка живет стабильно и успешно своей жизнью, разве что тоже не может пинговать проблемную машинку в обозначенный тут момент.
Пошутил про демона - нажал иконку.

Оффлайн acetone

  • Автор темы
  • Участник
  • *
  • Сообщений: 168
    • Просмотр профиля
    • Fediverse
Проблема сохраняется. После перезапуска ПК затыки не наблюдаются более длительное время (кажется), но затем повторное зависание сети возможно в течение часа-двух. До сих пор не выявил строгих зависимостей в периодах поломки. Максимальный срок работы без зависания - около суток.

$ ip a #Во время зависания
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
    link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
    inet 127.0.0.1/8 scope host lo
       valid_lft forever preferred_lft forever
    inet6 ::1/128 scope host
       valid_lft forever preferred_lft forever
2: enp4s0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc mq state UP group default qlen 1000
    link/ether d8:5e:d3:a5:ec:d1 brd ff:ff:ff:ff:ff:ff
    inet 192.168.161.99/24 brd 192.168.161.255 scope global enp4s0
       valid_lft forever preferred_lft forever
    inet6 fe80::da5e:d3ff:fea5:ecd1/64 scope link
       valid_lft forever preferred_lft forever

$ lspci #часть
Ethernet controller: Intel Corporation Ethernet Controller I225-V (rev 03)

$ dmesg #часть
[    4.067684] Intel(R) 2.5G Ethernet Linux Driver
[    4.067685] Copyright(c) 2018 Intel Corporation.
Пошутил про демона - нажал иконку.

Оффлайн jurganov

  • Старожил
  • *
  • Сообщений: 1402
    • Просмотр профиля
а пачкорд не менял?

Оффлайн acetone

  • Автор темы
  • Участник
  • *
  • Сообщений: 168
    • Просмотр профиля
    • Fediverse
а пачкорд не менял?

Чуть выше писал об этом :(

Менял Ethernet-кабель четыре раза. Сейчас использую патчкорд из магазина с заводской обжимкой. На обжимку грешить не могу - работает как и предыдущие кабели: с хорошим пингом и стабильным каналом. Но раз в какой-то необъяснимый промежуток случается полная потеря сети...


Пользователь добавил сообщение 17 Марта 2023, 16:29:52:
Буду рад не только прямому совету по делу (т.к. проблема носит уже околомагический характер), но о всевозможных средствах наблюдения за ОС в момент затыка для попытки диагностирования источника проблемы.
« Последнее редактирование: 17 Марта 2023, 16:29:52 от acetone »
Пошутил про демона - нажал иконку.

Оффлайн Peter_I

  • Старожил
  • *
  • Сообщений: 3026
    • Просмотр профиля
Попробуйте в /etc/sysctl.d/ в какой-нибудь conf-файл добавить эти строки
(Нажмите, чтобы показать/скрыть)
и дать команду
sysctl -pЕсли не поможет, есть и другие настройки tcp.
Пётр.

Оффлайн acetone

  • Автор темы
  • Участник
  • *
  • Сообщений: 168
    • Просмотр профиля
    • Fediverse
Если не поможет, есть и другие настройки tcp.

Спасибо! Утром сел за ПК - снова затык (на ночь не выключаю машину). Добавил ваши параметры в
/etc/sysctl.d/peter-help.confи сделал
sysctl -p
Буду наблюдать. О проблемах (и, тьфу-тьфу, успехе) сообщу тут в скором времени.

Пользователь добавил сообщение 18 Марта 2023, 10:43:54:
Ага. После добавления затык случился через считанные 15-20 минут. Посмотрю еще, попробую понять коррелирует ли столь малая пауза с параметрами, или на периодичность затыков манипуляции не повлияли.
« Последнее редактирование: 18 Марта 2023, 10:43:54 от acetone »
Пошутил про демона - нажал иконку.

Оффлайн Peter_I

  • Старожил
  • *
  • Сообщений: 3026
    • Просмотр профиля
Есть ещё параметры tcp_rmem и tcp_wmem и много других.
Сделайте поиск по tcp_rmem, 1-я же ссылка их выдаст.
Кстати, для программы на Qt недостаточно включить параметры с keepalive,
надо ещё в свойствах QTcpSocket включить KEEPALIVE.
« Последнее редактирование: 18 Марта 2023, 20:48:24 от Peter_I »
Пётр.

Оффлайн ALiEN

  • Администратор
  • Старожил
  • *
  • Сообщений: 6690
  • 20% Cooler
    • Просмотр профиля
В настройках попробуйте такие параметры:

🖥 AsRock B550M Pro4 :: AMD Ryzen 5 3600 :: 16 GB DDR4 :: AMD Radeon RX 6600 :: XFCE
💻 ACER 5750G :: Intel Core i5-2450M :: 6 GB DDR3 :: GeForce GT 630M :: XFCE

Оффлайн acetone

  • Автор темы
  • Участник
  • *
  • Сообщений: 168
    • Просмотр профиля
    • Fediverse
Ранее настраивал сеть через манипуляции с файлом /etc/network/interfaces.

Решил попробовать через графическую оболочку NetworkManager: убрал все из /etc/network/interfaces, создал подключение в GUI с дефолтными параметрами. Чтобы наверняка все изменения применились - ребутнул машину. Иконка сети в трее ожила: начала показывать активный статус подключения. Пока вручную работал с /etc/network/interfaces, гуйный модуль не отображал подключения (и их статус) вовсе. Но... прошла примерно половина суток и проблема повторилась. В этот раз решил ее не перетыканием шнура или systemctl restart networking, а переключателем в GUI: выключил проводное соединение и включил снова. Пинги в локальной сети и маршрут в интернет моментально ожили.

Пользователь добавил сообщение 20 Марта 2023, 10:39:17:
Выхлоп ethtool (не меняется во время работы или затыка):

sudo ethtool enp4s0
Settings for enp4s0:
Supported ports: [  ]
Supported link modes:   10baseT/Half 10baseT/Full
                        100baseT/Half 100baseT/Full
                        1000baseT/Full
                        2500baseT/Full
Supported pause frame use: Symmetric
Supports auto-negotiation: Yes
Supported FEC modes: Not reported
Advertised link modes:  10baseT/Half 10baseT/Full
                        100baseT/Half 100baseT/Full
                        1000baseT/Full
                        2500baseT/Full
Advertised pause frame use: Symmetric
Advertised auto-negotiation: Yes
Advertised FEC modes: Not reported
Speed: 1000Mb/s
Duplex: Full
Auto-negotiation: on
Port: Twisted Pair
PHYAD: 0
Transceiver: internal
MDI-X: off (auto)
Supports Wake-on: pumbg
Wake-on: g
        Current message level: 0x00000007 (7)
                               drv probe link
Link detected: yes

Пинги во время затыка (в локалке два ПК, одинаковое поведение при попытке пинга любого из них):
ping 192.168.161.1
PING 192.168.161.1 (192.168.161.1) 56(84) bytes of data.
From 192.168.161.99 icmp_seq=1 Destination Host Unreachable
From 192.168.161.99 icmp_seq=2 Destination Host Unreachable
From 192.168.161.99 icmp_seq=3 Destination Host Unreachable
From 192.168.161.99 icmp_seq=4 Destination Host Unreachable
From 192.168.161.99 icmp_seq=5 Destination Host Unreachable
« Последнее редактирование: 20 Марта 2023, 10:56:30 от acetone »
Пошутил про демона - нажал иконку.

Оффлайн acetone

  • Автор темы
  • Участник
  • *
  • Сообщений: 168
    • Просмотр профиля
    • Fediverse
По каким-то гайдам в интернете, связанным с похожими проблемами у юзеров с аналогичной сетевой картой на 2,5Gb/s, попробовал явно задать конфигурацию сети на 100Мб/Полный дуплекс (при том, что роутер гигабитный и локалка согласовывается автоматически на 1Gb/s).

Результатов не дало.
Пошутил про демона - нажал иконку.

 

Страница сгенерирована за 0.048 секунд. Запросов: 25.