Пришли к выводу, что все это отстой и УГ.
Все, что удалось собрать с новым компилятором, работает МЕДЛЕННЕЕ.
Так что было решено изменить архитектуру и поставить отдельный комп для синхронизации.

Всем спасибо.
Пользователь решил продолжить мысль 14 Августа 2009, 08:28:25:
Где у нас затыки, давно известно.

Например, последняя оптимизация заключалась в том, чтобы не удалять элементы вектора по отдельности, а уничтожать весь вектор, и на каждом шаге создавать новый. Раз в 6 быстрее так работает. Другие типы данных, кроме вектора, не подходят.
Главный затык все-таки - это странная работа Linuxа с 8 процессорами, а также весьма условная расстановка приоритетов.