Вобщем так: нужно научить wget выковыривать имена файлов из Content-header'а. А именно, пример... Есть такой сайт - karaoke.ru и там куча песен. Я хочу их скопом стянуть. Для чего делаю файлик со ссылками и заряжаю его в wget. Все бы ничего, но этот уродец по ссылке
httр://www.karaoke.ru/song/1/download/ вытягивает файл
index.html, хотя заголовок HTTP-ответа сервера содержит настоящее имя файла, т.е.
a_studio=belaja_reka.kar. Вот что он (уродец) пишет в логе:
Код:
--15:52:59-- http://www.karaoke.ru/song/1/download/
=> `index.html'
Connecting to *.*.*.*:*... connected.
Proxy request sent, awaiting response...
1 HTTP/1.0 200 OK
2 Date: Wed, 09 Mar 2005 13:00:04 GMT
3 Server: Apache/1.3.28 (Win32) PHP/4.3.9
4 Cache-Control: max-age=86400
5 Expires: Thu, 10 Mar 2005 13:00:04 GMT
6 X-Powered-By: PHP/4.3.9
7 Content-Disposition: attachment; filename="a_studio=belaja_reka.kar"
8 Content-Type: application/midi
9 Connection: close
0K .... 1.48 KB/s
15:53:29 (1.48 KB/s) - `index.html' saved [40062]
FINISHED --15:53:29--
Downloaded: 40,062 bytes in 1 files
Converted 0 files in 0.00 seconds.
Я, конечно, могу поступить согласно своей подписи, а именно: тупо стянуть кучу index.html'ей в разные папки и написать скрипт, который проанализирует лог и переименует енти html'ки должным образом. Но ведь, наверное, можно как-то сделать это и wget'ом?