Zanim powiesz "co próbujesz" i "przetestujesz to sam", chciałbym zauważyć, że robots.txt
aktualizacje strasznie powolne dla dowolnej witryny w wyszukiwarkach, więc jeśli mógłbyś dostarczyć teoretyczne doświadczenie, to byłoby docenione.Czy mogę użyć pliku robots.txt do zablokowania określonych parametrów adresu URL?
Na przykład, jest to możliwe, aby umożliwić:
http://www.example.com
I blok:
http://www.example.com/?foo=foo
nie jestem pewien.
Pomoc?
można spróbować użyć emulatora robota, ale stosując ** zaprzeczyć ** w pliku robots.txt nie znaczy wszystkie roboty będą go śledzić! –