Podobnie jak wielu innych programistów, pogrążyłem się w nowej technologii Apple ARKit. Wspaniale. W przypadku konkretnego projektu chciałbym jednak móc rozpoznać (rzeczywiste) obrazy w scenie, aby albo na nich projektować (tak jak robi to Vuforia z docelowymi obrazami), albo użyć go do wywołania zdarzenia w mojej aplikacji.Rozpoznawanie obrazu Apple Vision
W moich badaniach, jak to osiągnąć, natknąłem się na ramy Vision i CoreML firmy Apple. Wydaje się to obiecujące, chociaż nie byłem jeszcze w stanie tego objąć.
Jak rozumiem, powinienem być w stanie zrobić dokładnie to, czego chcę, znajdując prostokąty wykorzystujące framework Vision i zasilając je modelem CoreML, który po prostu porównuje go z docelowymi obrazami, które wstępnie zdefiniowałem w modelu. Powinien wtedy być w stanie wypluć, który obraz docelowy znalazł.
Chociaż brzmi to dobrze w mojej głowie, jeszcze nie znalazłem sposobu, aby to zrobić. Jak mógłbym stworzyć taki model i czy jest on w ogóle możliwy?
Zabawne, zastanawiałem się, jak to działa właśnie wczoraj. Dzięki, że pytasz! – LinusGeffarth