Właściwie pisząc skali skierowany robota jest dość trudnym zadaniem. Zaimplementowałem go w pracy i utrzymywałem go przez dłuższy czas. Istnieje wiele problemów, o których istnieniu nie wiesz, dopóki ich nie napiszesz i nie rozwiążesz problemów. W szczególności zajmuje się CDN i przyjaznym indeksowaniem stron. Algorytmy adaptacyjne są bardzo ważne lub użyjesz filtrów DOS. Tak czy owak, nie będziesz wiedział, czy twój indeks jest wystarczająco duży.
Co o tym myśleć:
- Co oprócz zdolnego przepustowości?
- Jak radzisz sobie z wyłączeniami witryny?
- Co się stanie, jeśli jesteś zablokowany?
- Czy chcesz zaangażować się w ukrywanie czołgania się (kontrewersyjne i właściwie dość trudne do uzyskania prawo)?
Naprawdę napisałem kilka rzeczy, że jeśli kiedykolwiek się do tego zabiorę, mogę umieścić online o budowie gąsienic, ponieważ zbudowanie właściwego jest o wiele trudniejsze, niż ludzie ci powiedzą. Większość robotów open source działa wystarczająco dobrze dla większości ludzi, więc jeśli możesz, polecam użyć jednego z nich. Który z nich jest wyborem funkcji/platformy.
tak! to książka, która wszystko zaczęła dla mnie. – KJW