2016-07-20 39 views
5

Mam zestawu replik (hostowane na Amazon), która posiada:MongoDB czas prośba replika tętno przekroczyło

  • podstawową
  • wtórny
  • arbiter

Wszystkie z nich są w wersji 3.2.6 a ta replika robi jeden fragment w mojej uszkodzonej gromadzie (jeśli jest to ważne, chociaż myślę, że tak nie jest).

Po wpisaniu rs.status() na podstawowym mówi, że nie może osiągnąć wtórny (to samo jest na arbitra):

 { 
     "_id" : 1, 
     "name" : "secondary-ip:27017", 
     "health" : 0, 
     "state" : 8, 
     "stateStr" : "(not reachable/healthy)", 
     "uptime" : 0, 
     "optime" : { 
      "ts" : Timestamp(0, 0), 
      "t" : NumberLong(-1) 
     }, 
     "optimeDate" : ISODate("1970-01-01T00:00:00Z"), 
     "lastHeartbeat" : ISODate("2016-07-20T15:40:50.479Z"), 
     "lastHeartbeatRecv" : ISODate("2016-07-20T15:40:51.793Z"), 
     "pingMs" : NumberLong(0), 
     "lastHeartbeatMessage" : "Couldn't get a connection within the time limit", 
     "configVersion" : -1 
    } 

(btw spojrzeć na optimeDate Oo)

błąd w moim dzienniku jest:

[ReplicationExecutor] Error in heartbeat request to secondary-ip:27017; ExceededTimeLimit: Couldn't get a connection within the time limit 

Dziwne jest to, że kiedy idę na średnie i wpisać rs.status() wszystko l ooks OK. Również jestem w stanie połączyć się z wtórnego z mojej podstawowej instancji (z mongo --host secondary), więc myślę, że to nie jest problem sieci. Wczoraj wszystko działało bez zarzutu.

TL; DR moim głównym nie widać wtórny i arbiter nie widać wtórny i mój wtórnym widzi podstawowy i to wszystko działa poprawnie tylko dni temu i jestem w stanie połączyć się ręcznie wtórny z podstawowej instancji.

Ktoś ma pojęcie, co może pójść nie tak?

Tnx, Ivan

+1

Jakie jest rozwiązanie tego problemu? Mój optimeDate jest taki sam. – Richard

Odpowiedz

0

Wydaje wtórnym optimeDate jest odpowiedzialna za błąd, najlepszym sposobem, aby poznać powody tej złej optimeDate jest zbadanie Wtórna maszyna aktualny czas data jak mógł też myl się. Nie jesteś pewien, czy wciąż szukasz odpowiedzi, ale problem polega na optymacie, a nie na połączeniu między maszynami replik.