Pracuję nad optymalizacją kodu, który analizuje dane z wykresów społecznych (z dużą pomocą od https://blog.golang.org/profiling-go-programs) i udało mi się przerobić wiele powolny kod.Jak zoptymalizować program golang, który spędza najwięcej czasu w runtime.osyield i runtime.usleep
Wszystkie dane są ładowane do pamięci z db pierwszy, a analiza danych z pojawia CPU związany (max zużycie pamięci < 10MB, CPU1 @ 100%)
Ale teraz większość czasu mój program wydaje się być w runtime.osyield i runtime.usleep. W jaki sposób temu zapobiec?
Ustawiłem GOMAXPROCS = 1, a kod nie odradza żadnych goroutines (innych niż te, które mogą wywoływać biblioteki golang).
To moje wyjście top10 z pprof
(pprof) top10
62550ms of 72360ms total (86.44%)
Dropped 208 nodes (cum <= 361.80ms)
Showing top 10 nodes out of 77 (cum >= 1040ms)
flat flat% sum% cum cum%
20760ms 28.69% 28.69% 20850ms 28.81% runtime.osyield
14070ms 19.44% 48.13% 14080ms 19.46% runtime.usleep
11740ms 16.22% 64.36% 23100ms 31.92% _/C_/code/sc_proto/cloudgraph.(*Graph).LeafProb
6170ms 8.53% 72.89% 6170ms 8.53% runtime.memmove
4740ms 6.55% 79.44% 10660ms 14.73% runtime.typedslicecopy
2040ms 2.82% 82.26% 2040ms 2.82% _/C_/code/sc_proto.mAvg
890ms 1.23% 83.49% 1590ms 2.20% runtime.scanobject
770ms 1.06% 84.55% 1420ms 1.96% runtime.mallocgc
760ms 1.05% 85.60% 760ms 1.05% runtime.heapBitsForObject
610ms 0.84% 86.44% 1040ms 1.44% _/C_/code/sc_proto/cloudgraph.(*Node).DeepestChildren
(pprof)
W _/C_/code/sc_proto/* funkcje mojego kodu.
(lepsza wersja SVG wykresu tutaj: https://goo.gl/Tyc6X4)
Twoje wykresy są nieczytelne. Nie mów nam, co robi twój program. [Jak utworzyć przykład minimalny, pełny i sprawdzalny.] (Http://stackoverflow.com/help/mcve). – peterSO
Czy używasz cgo? – JimB
@ JimB nie używa cgo; wszystko czysto Go – Aaron