Jak wiadomo, nowoczesny najpopularniejszym CNN (splotowe sieć neuronowa): VGG/ResNet (FasterRCNN), SSD, Yolo, Yolo v2, DenseBox, DetectNet - są nie obracać niezmienna: Are modern CNN (convolutional neural network) as DetectNet rotate invariant?Dlaczego niezmiennicze sieci neuronowe nie są wykorzystywane w zwycięzcach popularnych konkursów?
znany również, że istnieje kilka sieci neuronowe o wykrywanie obiektów Rotate-niezmienność:
Rotation niezmienny Neoperceptron 2006 (PDF): https://www.researchgate.net/publication/224649475_Rotation-Invariant_Neoperceptron
rotacji Nauka niezmiennicze splotu filtry do klasyfikacji tekstur (2016 PDF): https://arxiv.org/abs/1604.06720
RIFD-CNN: obrót o stałej Fisher dyskryminacyjna splotowych Neural Networks do wykrywania obiektów 2016 (PDF): http://www.cv-foundation.org/openaccess/content_cvpr_2016/html/Cheng_RIFD-CNN_Rotation-Invariant_and_CVPR_2016_paper.html
Zakodowane Niezmienniczość w splotowych Neural Networks 2014 (PDF)
Niezmienne splotowe splotowe sieci neuronowe do przewidywania morfologii galaktyk (PDF): https://arxiv.org/abs/1503.07077
Learning Obrót niezmienny splotowy Sieci neuronowe do detekcji obiektów w VHR optyczne Remote Sensing Images 2016: http://ieeexplore.ieee.org/document/7560644/
Wiemy, że w takich konkursach obraz wykrywania jak: image-net MSCOCO Pascal VOC - używane sieci zespoły (jednocześnie niektóre sieci neuronowe). Lub zestawy sieciowe w pojedynczej sieci, takie jak ResNet (Residual Networks Behave Like Ensembles of Relatively Shallow Networks)
Ale są używane niezmienne kombinacje sieciowe w zwycięzcach, takich jak MSRA, a jeśli nie, to dlaczego? Dlaczego w zespole dodatkowa niezmienna sieć rotacyjna nie zwiększa dokładności wykrywania niektórych obiektów, takich jak obiekty lotnicze - które obrazy są wykonywane pod różnymi kątami obrotu?
To może być:
Dlaczego rotacji -wariantowe sieci neuronowe nie są wykorzystywane w przypadku zwycięzców pularowe konkursy z wykrywaniem obiektów?
W wielu konkursach ludzie analizują każdą klasę i jej możliwe rotacje. Obraz samolotu na niebie może mieć każdy możliwy obrót, ale poziomy obraz psa, który nie biegnie. I generują nowe obrazy treningowe od oryginalnych z każdym możliwym obrotem. Być może jest to dokładniejsze niż algorytm niezmienny rotacyjny. Innym możliwym wyjaśnieniem jest to, że istnieją bardzo wydajne biblioteki do uruchamiania CNN na GPU (nie wiem, czy istnieją wydajne biblioteki na GPU dla niezmiennych rotacyjnych sieci neuronowych). – Rob
@Rob ** 1. ** Tak, podejście niezmiennikowe może być użyte tylko do transformacji afinicznej (do wykrywania obiektów powietrznych z ziemi lub obiektów naziemnych z powietrza), ale nie do transformacji eliptycznej (do wykrywania zwierząt), a nie do obracania się wokół osi poza płaszczyzną strzelania. Ale CNN może być używany jako dodatek do zwykłej sieci splotowej w zespołach. Rotate-invariant-CNN wymaga znacznie mniejszej ilości obrazów wejściowych i dostrajalnych parametrów - a przez to uczy się szybciej i dokładniej (dla najbardziej odpowiednich obiektów). – Alex
@Rob ** 2. ** Informacje o GPU. 5. Niezmienne splotowe splotowe sieci neuronowe do prognozowania morfologii galaktyk: '7.9 Implementacja ... To pozwoliło na użycie akceleracji GPU bez dodatkowego wysiłku ... Sieci zostały przeszkolone na kartach NVIDIA GeForce GTX 680." Https: // arxiv .org/pdf/1503.07077v1.pdf Może również być niezmiennikiem rotacyjnym 'cv :: SURF_GPU' w jakiś sposób może być użyty zamiast splotu-jądra (macierzy). – Alex