Potrzebuję utworzyć aplikację na Androida, która rozpoznaje określone pliki dźwiękowe utworzone przeze mnie i wykona akcję rozpoznawania. Coś podobnego do Shazam/Soundhound, ale z własnymi plikami dźwiękowymi. Czy istnieje jakieś API lub SDK, czy coś takiego? Czytałem o Echoprint, ale rozumiem, że jest on dla Windows i iOS i wydaje mi się dość trudne dla mnie. Czy to działa? Czy są jakieś inne opcje?Interfejs API rozpoznawania dźwięku, SDK (Android)
PS: Aby było jasne, nie chcę rozpoznawania głosu ani zamiany tekstu na mowę. Moje pliki dźwiękowe mogą mieć muzykę, zniekształcony głos, efekty itp.
Co to ty? nie chcesz rozpoznawania głosu, więc jak rozpoznać plik dźwiękowy ??? –
jak powiedziałem, chcę, aby rozpoznał pliki dźwiękowe takie jak Shazam czy Soundhound, a nie czyjeś polecenia głosowe – KKO
to było również używane w aplikacji Star Trek Into Darkness (Qualcomm's Gimbal), ale funkcja sdk nie została jeszcze publicznie udostępniona – KKO