Chciałbym odzwierciedlić prosty chroniony hasłem portal internetowy dla niektórych danych, które chciałbym zachować na bieżąco w postaci kopii zapasowej &. Zasadniczo ta strona to tylko lista katalogów z danymi zorganizowanymi w foldery & Nie obchodzi mnie utrzymanie plików HTML & innych elementów formatowania. Jednak istnieje kilka ogromnych typów plików, które są zbyt duże, aby je pobrać, więc chcę je zignorować.witryna lustrzana http, z wyłączeniem niektórych plików
Flaga prawie robi to, co chcę, z wyjątkiem tego, że wszystkie pliki zostaną pobrane, a jeśli pasują do flagi -R, zostaną usunięte.
Oto jak używam wget
:
wget --http-user userName --http-password password -R index.html,*tiff,*bam,*bai -m http://web.server.org/
który wytwarza moc takiego, potwierdzając, że wykluczony plik (index.html) (a) zostanie pobrana, oraz (b) następnie zostanie usunięty:
...
--2012-05-23 09: 38: 38-- http://web.server.org/folder/
Ponowne użycie istniejącego połączenia web.server.org:80.
Żądanie HTTP wysłane, oczekiwanie na odpowiedź ... Wymagane jest zezwolenie
Ponowne użycie istniejącego połączenia z web.server.org:80.
żądania HTTP wysłano, oczekiwanie na odpowiedź ... 200 OK
Długość: 2677 (2.6K) [text/html]
Zapisywanie do: `web.server.org/folder/index.html” 100% [= ================================================== ================================================== =================>] 2 677 -. K/s w 0 sBrakuje ostatnio zmodyfikowanego nagłówka - znaczniki czasu są wyłączone.
2012-05-23 09:38:39 (328 Mb/s) - `web.server.org/folder/index.html” zostawiony [2677/2677]
Usuwanie web.server.org/folder /index.html, ponieważ powinno zostać odrzucone.
...
czy istnieje sposób, aby wymusić wget odrzucić plik przed pobraniem?
Czy istnieje alternatywa, którą powinienem wziąć pod uwagę?
Ponadto, dlaczego otrzymuję błąd 401 Authorization Required
dla każdego pobranego pliku, pomimo podania nazwy użytkownika & hasło. To tak, jakby za każdym razem próbował połączyć się z nieuwierzytelnionym przed próbą nazwy użytkownika/hasła.
dzięki, Mark
See rozwiązanie dotyczące modyfikowania wget z tego (zduplikowanego) pytania: http://stackoverflow.com/questions/12704197/wget-reject-still-downloads-file – taranaki