Автор Тема: Прочитать файл, разбив каждую строку в массив (Прочитано 7461 раз)

iormark · « : 10 Декабря 2011, 12:01:27 »

Здравствуйте, подскажите, есть файл с такой структурой

id   picture
14   http://...img0.jpg
15   http://...img1.jpg

читаю файл так

Код: [Выделить]

file="list_picture"
while read line
do
  echo $line
  #здесь необходимо выполнить какие либо действия, например
  #wget -q -P `pwd` http://...img0.jpg -O 14.jpg
done < $file

т.е как разбить строку и подставить нужные значения?

ArcFi · « **Ответ #1 :** 10 Декабря 2011, 12:27:01 »

Попроще:

Код: (bash) [Выделить]

awk '{print $2}' urls.txt | wget -i-
Посложнее:

Код: (bash) [Выделить]

cat urls.txt | while read ; do wget "$(echo $REPLY | awk '{print $2}')" -O "$(echo $REPLY | awk '{print $1}').jpg" ; done

Вместо awk можно cut или bash-parameter-expansion.

iormark · « **Ответ #2 :** 10 Декабря 2011, 12:59:12 »

Спасибо))
первый вариант больше понравился

Код: (bash) [Выделить]

awk '{print "-q -P `pwd` "$2" -O "$1".jpg"}' list_picture | xargs -l wget
а как предусмотреть, если картинка с другим расширением?

ArcFi · « **Ответ #3 :** 10 Декабря 2011, 13:55:20 »

Цитата: iormark от 10 Декабря 2011, 12:59:12

а как предусмотреть, если картинка с другим расширением?

Думаю, придётся парсить второй столбец (url).
2-й вариант в этом смысле более легко масштабируем:

Код: (bash) [Выделить]

FILE_URL="$(echo $REPLY | awk '{print $2}')"
FILE_NAME_EXT="${URL##*.}"
FILE_NAME="${URL##*/}"

И кстати, в 1-м варианте можно обойтись без xargs. Cм. предыдущий пост.

iormark · « **Ответ #4 :** 10 Декабря 2011, 14:17:55 »

Только что прочитал что cut гораздо быстрее.. так что лучше cut))

Код: (bash) [Выделить]

cat list | while read ; do echo "$(cut -f2) $(cut -f1)"; doneвыведет только один столбец, c awk тоже самое $:-\$

ArcFi · « **Ответ #5 :** 10 Декабря 2011, 14:37:41 »

Цитата: iormark от 10 Декабря 2011, 14:17:55

Только что прочитал что cut гораздо быстрее.

Не всё, что пишут в интернетах, является правдой.

Код: [Выделить]

$ for i in {1..1000000} ; do echo "$i http://$i" ; done >>tmp.txt

$ time awk '{print $2}' tmp.txt >/dev/null 

real	0m0.781s
user	0m0.739s
sys	0m0.036s

$ time cut -d' ' -f2 tmp.txt >/dev/null 

real	0m2.789s
user	0m2.736s
sys	0m0.036s

iormark · « **Ответ #6 :** 10 Декабря 2011, 14:56:42 »

у меня такой результат

Код: [Выделить]

$ time awk '{print $2}' tmp.txt >/dev/null

real	0m0.462s
user	0m0.432s
sys	0m0.032s

$ time cut -d' ' -f2 tmp.txt >/dev/null

real	0m0.260s
user	0m0.236s
sys	0m0.024s

ArcFi · « **Ответ #7 :** 10 Декабря 2011, 16:29:31 »

Сейчас ради интереса запустил на нескольких машинах на работе.
Оказалось, что результаты сильно зависят от версий утилит/дистрибутивов/ядра и железа.
Тем не менее, awk уверенно вырвался вперёд на 7 машинах из 8 тестируемых, в среднем обгоняя cut в 1,5-2,5 раза.

iormark · « **Ответ #8 :** 10 Декабря 2011, 17:11:19 »

Клёво)) значит awk ))
а как быть с тем что не работает второй вызов awk '{print $1} ?

ArcFi · « **Ответ #9 :** 10 Декабря 2011, 17:53:30 »

Цитата: iormark от 10 Декабря 2011, 17:11:19

а как быть с тем что не работает второй вызов awk '{print $1} ?

В смысле, не работает?
Надо посмотреть на сам файл.

Код: [Выделить]

od -c file | headТам могут быть виндовые концы строк или хитрые разделители.

iormark · « **Ответ #10 :** 10 Декабря 2011, 18:09:29 »

Файл создаю так

Код: (bash) [Выделить]

mysql -u $user -p$pass -e "use $base; use book;select id,picture from book where picture!='' limit 2;" > list

Код: [Выделить]

$ od -c list | head
0000000   i   d  \t   p   i   c   t   u   r   e  \n   1   1   7   8   0
0000020   3   4  \t   h   t   t   p   :   /   /   b   i   g   .   j   p
0000040   g  \n
0000042

ArcFi · « **Ответ #11 :** 10 Декабря 2011, 18:50:03 »

У вас разделителем столбцов является символ табуляции.
В моей версии awk пробелы и табуляция по дефолту обрабатываются как разделители.
Возможно, у вас иначе.
Попробуйте так:

Код: [Выделить]

awk -F'[[:space:]]' ...
awk -F' |\t' ...
awk -F\\t ...

iormark · « **Ответ #12 :** 10 Декабря 2011, 19:46:09 »

уже под вечер не соображаю, все примеры просто копировал в терминал и всё работает, а потом положил в файл

Код: (bash) [Выделить]

#!/bin/bash
cat list | while read ; do echo "$(awk '{print $2}')" ; done

и вылазит это ошибка

Код: [Выделить]

read: 2: arg count

ArcFi · « **Ответ #13 :** 10 Декабря 2011, 20:18:31 »

Цитата: iormark от 10 Декабря 2011, 19:46:09

Код: (bash) [Выделить]
cat list | while read ; do echo "$(awk '{print $2}')" ; done

Строка читается в "$REPLY".

iormark · « **Ответ #14 :** 11 Декабря 2011, 09:35:05 »

Спасибо)) у меня вот так заработало

Код: (bash) [Выделить]

cat list | while read REPLY; do echo "$(echo $REPLY | awk '{print $2}') $(echo $REPLY | awk '{print $1}')"; done

Пользователь решил продолжить мысль 11 Декабря 2011, 09:53:43:

Заработало

Код: (bash) [Выделить]

cat list | while read REPLY; do 
  URL="$(echo $REPLY | awk '{print $2}')"
  EXT="${URL##*.}"
  wget -q -P `pwd` $URL -O $(echo $REPLY | awk '{print $1}')"."$EXT;
done

Форум русскоязычного сообщества Ubuntu

Автор Тема: Прочитать файл, разбив каждую строку в массив (Прочитано 7461 раз)

iormark

Прочитать файл, разбив каждую строку в массив

ArcFi

Re: Прочитать файл, разбив каждую строку в массив

iormark

Re: Прочитать файл, разбив каждую строку в массив

ArcFi

Re: Прочитать файл, разбив каждую строку в массив

iormark

Re: Прочитать файл, разбив каждую строку в массив

ArcFi

Re: Прочитать файл, разбив каждую строку в массив

iormark

Re: Прочитать файл, разбив каждую строку в массив

ArcFi

Re: Прочитать файл, разбив каждую строку в массив

iormark

Re: Прочитать файл, разбив каждую строку в массив

ArcFi

Re: Прочитать файл, разбив каждую строку в массив

iormark

Re: Прочитать файл, разбив каждую строку в массив

ArcFi

Re: Прочитать файл, разбив каждую строку в массив

iormark

Re: Прочитать файл, разбив каждую строку в массив

ArcFi

Re: Прочитать файл, разбив каждую строку в массив

iormark

Re: Прочитать файл, разбив каждую строку в массив