2016-05-17 26 views

Odpowiedz

64

W nowej wersji (scrapy 1.1) uruchomionej 2016-05-11 indeksowanie najpierw pobiera plik robots.txt przed zaindeksowaniem. Aby zmienić tę zmianę zachowań w twojej settings.py z ROBOTSTXT_OBEY

ROBOTSTXT_OBEY=False 

Oto release notes

0

Pierwszą rzeczą, którą musisz zapewnić, to zmienić klienta użytkownika w żądaniu, w przeciwnym razie domyślny agent użytkownika zostanie zablokowany na pewno.