Mam site, który chcę pobrać przy użyciu Uniksa wget
. Jeśli spojrzysz na kod źródłowy i zawartość pliku, zawiera on sekcję o nazwie SUMMARY. Jednak po wydaniu polecenia wget tak:Jak włączyć 'wget', aby pobrać całą zawartość HTML z Javascriptem
wget -O downdloadedtext.txt http://www.ncbi.nlm.nih.gov/IEB/Research/Acembly/av.cgi?db=mouse&c=gene&a=fiche&l=2610008E11Rik
Zawartość downdloadedtext.txt
jest niekompletna i inny z kodem źródłowym z tej witryny. Na przykład nie zawiera sekcji PODSUMOWANIE. Czy istnieje poprawny sposób na uzyskanie pełnej treści poprawnie?
Powód, dla którego pytam o to, ponieważ chcę zautomatyzować pobieranie z różnych wartości w tym kodzie HTML.
Nie rozumiem. Jakie różnice występują w kodzie źródłowym? A co ma z tym wspólnego JavaScript? –
@Pekka: Ciało zawierające javascript nie zostanie pobrane. Spróbuj i zobacz. – neversaint
Nie mam wget teraz przydatny (na komputerze z systemem Windows). Czy rzeczywiste * ciało * jest inne lub czy pliki js nie są pobierane? –