2013-06-20 14 views
12

Potrzebuję utworzyć aplikację na Androida, która rozpoznaje określone pliki dźwiękowe utworzone przeze mnie i wykona akcję rozpoznawania. Coś podobnego do Shazam/Soundhound, ale z własnymi plikami dźwiękowymi. Czy istnieje jakieś API lub SDK, czy coś takiego? Czytałem o Echoprint, ale rozumiem, że jest on dla Windows i iOS i wydaje mi się dość trudne dla mnie. Czy to działa? Czy są jakieś inne opcje?Interfejs API rozpoznawania dźwięku, SDK (Android)

PS: Aby było jasne, nie chcę rozpoznawania głosu ani zamiany tekstu na mowę. Moje pliki dźwiękowe mogą mieć muzykę, zniekształcony głos, efekty itp.

+0

Co to ty? nie chcesz rozpoznawania głosu, więc jak rozpoznać plik dźwiękowy ??? –

+0

jak powiedziałem, chcę, aby rozpoznał pliki dźwiękowe takie jak Shazam czy Soundhound, a nie czyjeś polecenia głosowe – KKO

+0

to było również używane w aplikacji Star Trek Into Darkness (Qualcomm's Gimbal), ale funkcja sdk nie została jeszcze publicznie udostępniona – KKO

Odpowiedz

1

Rok później zakończyłem korzystanie z Echoprint skompilowanego dla Androida, zgodnie z wyjaśnieniem here. Osiąga pewne wyniki, ale generalnie działa bardzo słabo, szczególnie w przypadku niestandardowych plików dźwiękowych. Echoprint nie jest przeznaczony do rozpoznawania OTA. Poleciłbym go do testowania/tworzenia prototypów, ale nie do produkcji. Niestety, jak na razie jest to jedyny, który pozwala mieć własny serwer i pliki dźwiękowe.

+0

ACRCloud jest usługą rozpoznawania audio/muzyki, która obsługuje zdefiniowane przez użytkownika wyszukiwanie DB, co oznacza, że ​​użytkownik może wgrać własne Pliki audio/muzyczne do budowania indeksu audio/muzyki. Proszę zobaczyć: https://github.com/acrcloud/webapi_przykład i http://console.acrcloud.com/demo – FernandoSanchez

+0

Pracuję nad projektem rozpoznawania głośników/identyfikacji głośników przez dźwięk sprzed sklepu. To będzie pomocne w tym ??? –

4

ACRCloud obsługuje wyszukiwarkę muzyki/dźwięku, 50 milionów piosenek/treści przesyłanych przez użytkowników, SDK dla systemów iOS/Android/Linux, które można pobrać po rejestracji (http://console.acrcloud.com/signup). Istnieją trzy poziomy dla klientów:

  • bezpłatny kondygnacja, na demo/prototypów
  • Przyspieszenie Poziom dla startupów
  • tier komercyjna

Życzenie to pomaga

+0

Właśnie złożyłem aplikację testową tej usługi i wygląda bardzo obiecująco. Dokumenty zdecydowanie potrzebują i podlegają przeglądowi, a wszystko dookoła wygląda jak usługa, która wciąż się rozwija, ale było to bardzo łatwe do rozpoczęcia i działało przy pierwszej próbie. – MattC

+0

dzięki, poprawiliśmy konsolę i kod przykładowy można znaleźć tutaj: https://github.com/acrcloud/webapi_example – FernandoSanchez