Идея такова:
есть кучка .html файлов (эта кучка качается при помощи wget). Из кучки этих файлов нужно вытащить строки находящиеся между определенными тегами. Сидел думал-думал - сделал, работает (делал не на нужных файлах, а на тестовом файле).
Думал вроде пока качать файлики и выдергивать все что нужно. И сразу же уперся в проблему, откуда не ждал: wget качает странички в Windowsовской кодировке. Возник вопрос, как поменять кодирову?