Ребята помогите решить задачу, а то с sed что то я никак разобраться не могу, а допилить shell скрипт во как нужно.
Исходные условия:
Дописываю скрипт мониторинга по словам.
Есть некий скрипт, который делает запрос к базе Mysql и выгружает результат в файл. Далее данные сверяются со вторым файлом ( Стоп слова ) и результат совпадений выводится в третий. Далее все это формируется в html письмо и отправляется на почту.
Пример выгрузки:
user_id originator phone lower(text) date
1002 VsyNakhodka 79143407831 490 - ваш код потверждения номера телефона в приложении вся находка 2014-06-04 11:01:47
1221 BazaB2B 79049837084 снять жилье от собственников - сайт bazab2b.ru. все варианты модери 2014-06-04 11:01:53
1002 Settle 79144079009 ул.вахова, тип: 3х-комнатная квартира, цена: 27000, тел.: 891454674 2014-06-04 11:01:53
1221 BazaB2B 79049837084 руются и выставляются в режиме on-line 2014-06-04 11:01:53
1002 Settle 79144079009 53, имя: евгения 2014-06-04 11:01:53
Файл со словами:
8г
9г
bombey
energy
Сейчас итоговое письмо выглядит примерно так:
Обнаружены смс, содержащие стоп слова:
Id пользователя; Имя; Номер абонента; Текст; Дата;
1002 Baraban Dom 79122210803 барабаны с обиди на каникулы ушли! до сентября! +79122122222 2014-06-04 12:42:03
Список стоп слов:
а,б,в и т.д
Нужно чтобы те слова, которые обнаружены в тексте каким то образом выделялись.
По моей логике нужно делать следующее:
1) Сделать сравнение списка стоп слов и итогового результата, и там где есть совпадение подставить перед словом <bold> и после него закрыважщий тег </bold>, так как формат html этого вполне достаточно. Насколько я понял все это
можно реализовать с помощью sed, но как написать такую громоздкую конструкцию я ума не приложу.
Помогите решить задачку, или хотябы ткните носом в хороший учебник по sed.