awk - простенький, но давольно мощный язык, perl наконец. Кстати может и обычный grep подойти:
cat input_file.html | grep --only-matching "regexp" > output_file
где-то так. Только регулярное выражение составь (man grep).
Если ссылки надо не просто сохранять в отдельный файл, а еще какие-то операции над ними проделывать, то лучше сразу перл.