IMHO.WS - Показать сообщение отдельно - [FreeWare] Wget - (GNU Wget) свободная неинтерактивная консольная файлокачалка

Ghost · 09.03.2005, 16:42

Вобщем так: нужно научить wget выковыривать имена файлов из Content-header'а. А именно, пример... Есть такой сайт - karaoke.ru и там куча песен. Я хочу их скопом стянуть. Для чего делаю файлик со ссылками и заряжаю его в wget. Все бы ничего, но этот уродец по ссылке httр://www.karaoke.ru/song/1/download/ вытягивает файл index.html, хотя заголовок HTTP-ответа сервера содержит настоящее имя файла, т.е. a_studio=belaja_reka.kar. Вот что он (уродец) пишет в логе:

Код:

--15:52:59--  http://www.karaoke.ru/song/1/download/
           => `index.html'
Connecting to *.*.*.*:*... connected.
Proxy request sent, awaiting response... 
 1 HTTP/1.0 200 OK
 2 Date: Wed, 09 Mar 2005 13:00:04 GMT
 3 Server: Apache/1.3.28 (Win32) PHP/4.3.9
 4 Cache-Control: max-age=86400
 5 Expires: Thu, 10 Mar 2005 13:00:04 GMT
 6 X-Powered-By: PHP/4.3.9
 7 Content-Disposition: attachment; filename="a_studio=belaja_reka.kar"
 8 Content-Type: application/midi
 9 Connection: close

    0K ....                                                  1.48 KB/s

15:53:29 (1.48 KB/s) - `index.html' saved [40062]


FINISHED --15:53:29--
Downloaded: 40,062 bytes in 1 files
Converted 0 files in 0.00 seconds.

Я, конечно, могу поступить согласно своей подписи, а именно: тупо стянуть кучу index.html'ей в разные папки и написать скрипт, который проанализирует лог и переименует енти html'ки должным образом. Но ведь, наверное, можно как-то сделать это и wget'ом?

09.03.2005, 16:42	# 30
Ghost ::VIP:: Звезда первого сезона Молчун-2004 Регистрация: 24.08.2002 Сообщения: 1 575	Вобщем так: нужно научить wget выковыривать имена файлов из Content-header'а. А именно, пример... Есть такой сайт - karaoke.ru и там куча песен. Я хочу их скопом стянуть. Для чего делаю файлик со ссылками и заряжаю его в wget. Все бы ничего, но этот уродец по ссылке httр://www.karaoke.ru/song/1/download/ вытягивает файл index.html, хотя заголовок HTTP-ответа сервера содержит настоящее имя файла, т.е. a_studio=belaja_reka.kar. Вот что он (уродец) пишет в логе: Код: --15:52:59-- http://www.karaoke.ru/song/1/download/ => `index.html' Connecting to ...:*... connected. Proxy request sent, awaiting response... 1 HTTP/1.0 200 OK 2 Date: Wed, 09 Mar 2005 13:00:04 GMT 3 Server: Apache/1.3.28 (Win32) PHP/4.3.9 4 Cache-Control: max-age=86400 5 Expires: Thu, 10 Mar 2005 13:00:04 GMT 6 X-Powered-By: PHP/4.3.9 7 Content-Disposition: attachment; filename="a_studio=belaja_reka.kar" 8 Content-Type: application/midi 9 Connection: close 0K .... 1.48 KB/s 15:53:29 (1.48 KB/s) - `index.html' saved [40062] FINISHED --15:53:29-- Downloaded: 40,062 bytes in 1 files Converted 0 files in 0.00 seconds. Я, конечно, могу поступить согласно своей подписи, а именно: тупо стянуть кучу index.html'ей в разные папки и написать скрипт, который проанализирует лог и переименует енти html'ки должным образом. Но ведь, наверное, можно как-то сделать это и wget'ом? __________________ Действовать надо тупо и это лучшее доказательство нашей чистоты и силы!