Wszystko jest w tytule!Zdefiniuj katalog pobierania selenu chromedriver z pytonem
Czy istnieje sposób zdefiniowania katalogu pobierania dla selen-chromedriver używanego z pythonem?
Pomimo wielu badań, nie znalazłem czegoś rozstrzygającego ... Jako początkujący widziałem wiele rzeczy o "pożądanych możliwościach" lub "opcjach" dla Chromedrivera, ale nic nie rozwiązało mojego problemu. .. (i wciąż nie wiem, czy to będzie!)
Aby wyjaśnić nieco więcej mojego problemu: Mam wiele adresów URL do skanowania (200 000) i dla każdego adresu URL plik do pobrania. Muszę utworzyć tabelę z adresem URL, informacje, które ja złapałem, ORAZ nazwę pliku, który właśnie pobrałem dla każdej strony. Z objętością, którą muszę wyleczyć, stworzyłem wątki, które otwierają wiele wystąpień chromedriver, aby przyspieszyć leczenie. Problem polega na tym, że każdy pobrany plik pojawia się w tym samym domyślnym katalogu i nie jestem w stanie połączyć pliku z adresem URL ... Chodzi o to, aby utworzyć katalog pobierania dla każdego wątku, aby móc nim zarządzać. jeden.
Jeśli ktoś ma odpowiedź na moje pytanie w tytule lub obejście problemu, aby zidentyfikować pobrany plik i połączyć go z bieżącym adresem URL, będę wdzięczny!
Generalnie chciałbym zaproponować Ci nie pobierać rzeczy w Chrome, to zwykle źle przemyślane test, który po prostu pobiera wszystko w folderze statycznej. Czy robisz cokolwiek z pobranymi plikami? Czytać o tym: http://ardesco.lazerycode.com/index.php/2012/07/how-to-download-files-with-selenium-and-why-you-shouldnt/, a następnie ten http://www.blog.pythonlibrary.org/2012/06/07/python-101-how-to-download-a-file/ – Ardesco
cześć Witam i dziękuję za odpowiedź. Tak naprawdę nie używam Selenium do uruchamiania testów, ale tak naprawdę do zautomatyzowania ogromnych pobrań pliku csv danych do obróbki końcowej. Próbowałem poznać sposób urllib2, ale spotkałem się z trudnymi problemami, aby uwierzytelnić się na stronie ... (prawdopodobnie dlatego, że jestem niedzielnym nowicjuszem, a Selen to gąska o złotym jajku, kiedy ją znalazłem! ...) – matlabat